订阅以接收新文章的通知:

Workers KV — Cloudflare的分布式数据库

2019-05-21

5 分钟阅读时间
这篇博文也有 EnglishDeutsch日本語EspañolFrançais版本。

今天,我们很高兴地宣布Workers KV即将普遍可用并为生产使用做好了准备!

什么是Workers KV?

Workers KV是一个高度分布、终极一致的键值存储数据库,跨越Cloudflare的全球边缘网络。它允许您存储数十亿个键值对,并且您在世界各地都能以极低的延迟读取它们。现在,您可以构建整个拥有CDN静态缓存性能的应用程序。

我们为什么要构建它?

Workers是一个平台,允许您在Cloudflare全球175+个(直至2019年9月已经扩展为193个)数据中心的边缘运行JavaScript。只需几行代码,您就可以路由HTTP请求,更改响应,甚至可以在没有原始服务器的情况下创建新的响应。

// A Worker that handles a single redirect,
// such a humble beginning...
addEventListener("fetch", event => {
  event.respondWith(handleOneRedirect(event.request))
})

async function handleOneRedirect(request) {
  let url = new URL(request.url)
  let device = request.headers.get("CF-Device-Type")
  // If the device is mobile, add a prefix to the hostname.
  // (eg. example.com becomes mobile.example.com)
  if (device === "mobile") {
    url.hostname = "mobile." + url.hostname
    return Response.redirect(url, 302)
  }
  // Otherwise, send request to the original hostname.
  return await fetch(request)
}

客户很快就向我们提供了一些用例,这些用例都需要一种存储持久性数据的方法。按照我们上面的例子,处理一个重定向是非常容易的,但是如果您想处理数十亿个重定向呢?您必须将它们硬编码到您的Workers脚本中,将它们都压缩到1MB以下,并在每次需要进行更改时重新部署它们——唉!这就是为什么我们构建了Workers KV。

// A Worker that can handle billions of redirects,
// now that's more like it!
addEventListener("fetch", event => {
  event.respondWith(handleBillionsOfRedirects(event.request))
})

async function handleBillionsOfRedirects(request) {
  let prefix = "/redirect"
  let url = new URL(request.url)
  // Check if the URL is a special redirect.
  // (eg. example.com/redirect/<random-hash>)
  if (url.pathname.startsWith(prefix)) {
    // REDIRECTS is a custom variable that you define,
    // it binds to a Workers KV "namespace." (aka. a storage bucket)
    let redirect = await REDIRECTS.get(url.pathname.replace(prefix, ""))
    if (redirect) {
      url.pathname = redirect
      return Response.redirect(url, 302)
    }
  }
  // Otherwise, send request to the original path.
  return await fetch(request)
}

只需对我们之前的示例进行一些更改,我们就可以从一个重定向扩展到数十亿个——这就是您可以使用Workers KV构建的内容。

它是如何工作的?

分布式数据存储通常使用CAP定理建模,该定理指出分布式系统只能在以下3个指标的两两组合中进行选取:

  • Consistency(一致性)——我的数据是否在各地都一样?

  • Availability(可用性)——我是否可以随时访问我的数据?

  • Partition tolerance(分区容错)——我的数据对区域传输中断有弹性吗?

Workers KV选择满足一致性与分区容错。这种组合被称为终极一致性,它为Workers KV提供了两个独特的竞争优势:

  • 读取速度非常快(中位数为12毫秒),因为它是由我们的缓存技术支持的。

  • 数据在我们175+(现在是193个)边缘数据中心可用,并且对区域中断具有容错性。

不过,终极一致性存在弊端。如果两个客户端同时向同一个键写入不同的值,最后进行写操作的客户端_最终_会“获胜”,其写入值将变为全局一致的。这也意味着,如果一个客户端对一个键进行写操作,而该客户端又读取了相同的键,那么这些值可能会在短时间内不一致(根据交互延迟与系统负载情况会需要不同时间才能全局统一为新的值)。

为了帮助生动具体的展现这个场景,以下我们列举了一个真实案例:

  • 假设Matthew,Michelle和Lee正在计划每周的午餐。

  • Matthew决定出去吃寿司。

  • Matthew告诉了Michelle他们吃寿司的计划,Michelle表示同意。

  • Lee并不知道这个计划,他告诉Michelle他们实际上要吃披萨。

一个小时后,Michelle和Lee在比萨店等着,而Matthew则一个人坐在寿司店——问题出在哪呢?我们可以把这归因于终极一致性,因为在等了几分钟后,Matthew看了看他的更新过的日历,最终发现了新的计划,他们转而去吃披萨了。

虽然在现实生活中可能需要几分钟,但Workers KV要快得多。它可以在60秒内实现全局一致性。此外,当Worker写入键值,然后_立即_读取相同的键值时,如果两个操作来自同一个位置,则可以预期读出的值与写入是一致的。

我应该什么时候使用它?

现在您已经了解了使用终极一致性的好处和弊端,您该如何确定它是否适合您的应用程序呢?简而言之,如果您想拥有超快速读取的全球可用性数据,Workers KV就很适合您。

但是,如果您的应用程序经常相同的键进行写入,那么您就需要另外考虑。我们称之为“Matthews问题”:你能接受世界各地的Matthews偶尔去错餐厅吗?

你可以想象一些用例(例如我们的重定向Worker示例),在这些用例中,(Matthews问题)不会产生任何实质性的差异。但是,如果您决定跟踪用户的银行帐户余额,您不会希望一个账户同时存在两个余额,因为这样的话他们就可以用已经花掉的钱再买一些东西。

我可以用它构建什么?

以下是使用KV构建的一些应用程序的示例:

  • 批量重定向——处理数十亿个HTTP重定向。

  • 用户身份验证——验证用户对API的请求。

  • 翻译键值——动态本地化您的网页。

  • 配置数据——管理谁可以访问您的源。

  • 阶跃函数——在多个API函数之间同步状态数据。

  • 边缘文件存储——托管大量小文件。

在之前发布的博客中,我们已经强调了其中的几个用例。我们还有一些更深入的代码演练,包括最近发布的一篇关于如何使用Workers KV构建在线待办事项列表的博客。

测试版之后更新了什么新的内容?

到目前为止,我们最常见的需求是使向Workers KV让写入数据变得更容易。这就是为什么我们发布了三种新方法来让这种体验变得更好:

1.批量写入

当您想将现有数据导入Workers KV时,您不会想要为每个键值对发送HTTP请求。这就是为什么我们向Cloudflare API添加了一个批量端点。现在,您可以在单个PUT请求中上传最多10000对键值(最多100MB的数据)。

curl "https://api.cloudflare.com/client/v4/accounts/ \
     $ACCOUNT_ID/storage/kv/namespaces/$NAMESPACE_ID/bulk" \
  -X PUT \
  -H "X-Auth-Key: $CLOUDFLARE_AUTH_KEY" \
  -H "X-Auth-Email: $CLOUDFLARE_AUTH_EMAIL" \
  -d '[
    {"key": "built_by",    value: "kyle, alex, charlie, andrew, and brett"},
    {"key": "reviewed_by", value: "joaquin"},
    {"key": "approved_by", value: "steve"}
  ]'

让我们来看一个用例:您希望将网站翻译任务离线到Workers上进行。由于您经常需要读取翻译键,并且只是偶尔更新它们,因此该应用程序与Workers KV的终极一致性模型可以很好地配合。

在本例中,我们看到Crowdin,这是一个流行的管理翻译数据的平台。这个Worker模型可以对一个/translate端点做出响应,下载你所有的翻译键,并批量写入Workers KV,以便您以后可以在我们的边缘网络读取它:

addEventListener("fetch", event => {
  if (event.request.url.pathname === "/translate") {
    event.respondWith(uploadTranslations())
  }
})

async function uploadTranslations() {
  // Ask crowdin for all of our translations.
  var response = await fetch(
    "https://api.crowdin.com/api/project" +
    "/:ci_project_id/download/all.zip?key=:ci_secret_key")
  // If crowdin is responding, parse the response into
  // a single json with all of our translations.
  if (response.ok) {
    var translations = await zipToJson(response)
    return await bulkWrite(translations)
  }
  // Return the errored response from crowdin.
  return response
}

async function bulkWrite(keyValuePairs) {
  return fetch(
    "https://api.cloudflare.com/client/v4/accounts" +
    "/:cf_account_id/storage/kv/namespaces/:cf_namespace_id/bulk",
    {
      method: "PUT",
      headers: {
        "Content-Type": "application/json",
        "X-Auth-Key": ":cf_auth_key",
        "X-Auth-Email": ":cf_email"
      },
      body: JSON.stringify(keyValuePairs)
    }
  )
}

async function zipToJson(response) {
  // ... omitted for brevity ...
  // (eg. https://stuk.github.io/jszip)
  return [
    {key: "hello.EN", value: "Hello World"},
    {key: "hello.ES", value: "Hola Mundo"}
  ]
}

2.有限期键值

async function translate(keys, lang) {
  // You bind your translations namespace to the TRANSLATIONS variable.
  return Promise.all(keys.map(key => TRANSLATIONS.get(key + "." + lang)))
}

在默认情况下,储存在Workers KV中的键值对会永久存在。然而,有时候您希望在一段时间后自动删除数据。这就是为什么我们要为写操作引入expiration(有效期)和expirationTtl(截止日期)选项。

假设您想要阻止那些被标记为不合适的用户访问您的网站,但是仅仅需要阻止一个星期。使用有期限键值,您就可以设置过期时间,而不必想着稍后再去删除它。

// Key expires 60 seconds from now.
NAMESPACE.put("myKey", "myValue", {expirationTtl: 60})

// Key expires if the UNIX epoch is in the past.
NAMESPACE.put("myKey", "myValue", {expiration: 1247788800})
# You can also set keys to expire from the Cloudflare API.
curl "https://api.cloudflare.com/client/v4/accounts/ \
     $ACCOUNT_ID/storage/kv/namespaces/$NAMESPACE_ID/ \
     values/$KEY?expiration_ttl=$EXPIRATION_IN_SECONDS"
  -X PUT \
  -H "X-Auth-Key: $CLOUDFLARE_AUTH_KEY" \
  -H "X-Auth-Email: $CLOUDFLARE_AUTH_EMAIL" \
  -d "$VALUE"

在本例中,我们假设用户和IP地址是相同的。如果应用程序具有身份验证,则可以使用访问令牌作为键值标识符。

3.更大的数值

addEventListener("fetch", event => {
  var url = new URL(event.request.url)
  // An internal API that blocks a new user IP.
  // (eg. example.com/block/1.2.3.4)
  if (url.pathname.startsWith("/block")) {
    var ip = url.pathname.split("/").pop()
    event.respondWith(blockIp(ip))
  } else {
    // Other requests check if the IP is blocked.
   event.respondWith(handleRequest(event.request))
  }
})

async function blockIp(ip) {
  // Values are allowed to be empty in KV,
  // we don't need to store any extra information anyway.
  await BLOCKED.put(ip, "", {expirationTtl: 60*60*24*7})
  return new Response("ok")
}

async function handleRequest(request) {
  var ip = request.headers.get("CF-Connecting-IP")
  if (ip) {
    var blocked = await BLOCKED.get(ip)
    // If we detect an IP and its blocked, respond with a 403 error.
    if (blocked) {
      return new Response({status: 403, statusText: "You are blocked!"})
    }
  }
  // Otherwise, passthrough the original request.
  return fetch(request)
}

我们已经将值的大小限制从64 kB增加到2MB。如果您需要将基于缓冲区的数据或文件数据存储在Workers KV中,这是非常有用的。

考虑一下这个场景:您想让您的用户上传他们最喜欢的GIF到他们的个人资料中,而不需要将这些GIF作为二进制文件存储在您的数据库中,或者需要您管理_另一个_云存储器。

Workers KV非常适合这个用例!您可以为用户的GIF创建Workers KV命名空间,无论客户身在何处,都可以快速,可靠地使用它。

在这个例子中,用户上传一个他们最喜欢的GIF的链接,然后Worker再将链接下载下来并储存到Workers KV。

最后,我们要感谢所有测试版客户。正是您宝贵的反馈意见促使我们对Workers KV进行了这些改进。请务必与我们保持联系,我们始终展望着未来,我们希望听到您的意见!

addEventListener("fetch", event => {
  var url = event.request.url
  var arg = request.url.split("/").pop()
  // User sends a URI encoded link to the GIF they wish to upload.
  // (eg. example.com/api/upload_gif/<encoded-uri>)
  if (url.pathname.startsWith("/api/upload_gif")) {
    event.respondWith(uploadGif(arg))
    // Profile contains link to view the GIF.
    // (eg. example.com/api/view_gif/<username>)
  } else if (url.pathname.startsWith("/api/view_gif")) {
    event.respondWith(getGif(arg))
  }
})

async function uploadGif(url) {
  // Fetch the GIF from the Internet.
  var gif = await fetch(decodeURIComponent(url))
  var buffer = await gif.arrayBuffer()
  // Upload the GIF as a buffer to Workers KV.
  await GIFS.put(user.name, buffer)
  return gif
}

async function getGif(username) {
  var gif = await GIFS.get(username, "arrayBuffer")
  // If the user has set one, respond with the GIF.
  if (gif) {
    return new Response(gif, {headers: {"Content-Type": "image/gif"}})
  } else {
    return new Response({status: 404, statusText: "User has no GIF!"})
  }
}

价格

我们也准备宣布我们正式版的定价。如果您是我们的企业客户之一,您的定价显然是保持不变的。

  • 数据储存每GB价格$0.50,包含1GB

  • 数据读取每百万次价格$0.50,包含1000万次

  • 数据写入,陈列和删除操作每百万次价格$5,包含1百万次

在测试阶段,我们了解到客户不仅想要在我们的边缘网络读取值,他们还想从我们的边缘网络写入值。由于这些边缘操作的需求很高,而且成本更高,所以我们开始每月对非读取操作收费。

上限

如前所述,我们将值的大小限制从64 kB增加到了2 MB。我们还删除了每个命名空间的键值数量上限——它现在是无限的。以下是我们正式版的限制:

  • 每个帐户最多20个命名空间,每个命名空间都有无限制的键值

  • 键数最大512个字节,键值最大2 MB

  • 每秒不同的键可写入无数次

  • 每秒相同的键仅能写入一次

  • 每个键每秒无限次读取

现在就来试试吧!

Workers KV现在对所有客户开放,您现在可以在Cloudflare控制面板中Workers选项卡下启用Workers KV。您还可以查看我们的更新文档

看到你们都可以用Workers KV构建应用程序,我们真的很高兴!

无服务器 Workers Workers KV JavaScript Bash

我们保护整个企业网络,帮助客户高效构建互联网规模的应用程序,加速任何网站或互联网应用程序抵御 DDoS 攻击,防止黑客入侵,并能协助您实现 Zero Trust 的过程

从任何设备访问 1.1.1.1,以开始使用我们的免费应用程序,帮助您更快、更安全地访问互联网。要进一步了解我们帮助构建更美好互联网的使命,请从这里开始。如果您正在寻找新的职业方向,请查看我们的空缺职位
ServerlessCloudflare WorkersCloudflare Workers KVJavaScript产品新闻Programming开发人员Developer Platform

在 X 上关注

Ashcon Partovi|@ashconpartovi
Cloudflare|@cloudflare

相关帖子

2024年10月31日 13:00

Moving Baselime from AWS to Cloudflare: simpler architecture, improved performance, over 80% lower cloud costs

Post-acquisition, we migrated Baselime from AWS to the Cloudflare Developer Platform and in the process, we improved query times, simplified data ingestion, and now handle far more events, all while cutting costs. Here’s how we built a modern, high-performing observability platform on Cloudflare’s network. ...