Cloudflare Workers 生态系统现已提供广泛的产品和功能,涵盖计算、托管、存储、数据库、流式传输、联网、安全等等。一直以来,我们不断尝试鼓励其他人从传统软件架构转移出来,并证明和记录在我们的技术栈上构建可全球扩展的复杂应用程序是可行的。
今天,我们高兴地欢迎 Constellation 加入到 Cloudflare 技术栈中,使开发人员能够在 Cloudflare 网络上运行预先训练好的机器学习模型和推理任务。
我们的 Supercloud 再添砖瓦
机器学习和人工智能最近成为了热门话题,但事实上,我们多年来一直在日常生活中使用这些技术,即使我们没有意识到。例如,我们的手机、电脑、汽车和家庭助手等都拥有人工智能。它已经无处不在。
然而,对于开发人员来说,它还没有成为一种商品。开发人员通常需要理解其背后的数学原理,相关软件和工具分散且复杂,而且运行这些框架和数据所需的硬件或云服务成本高昂。
今天,我们的技术栈引入另一个功能,使每个人都可以在 Cloudflare Workers 上运行机器学习模型并执行推理任务。
Constellation 简介
Constellation 允许您原生通过 Cloudflare Workers 脚本使用预先训练的机器学习模型运行快速、低延迟的推理任务。
可用 Constellation 部署的一些应用程序示例如下:
图像或音频分类或物体检测
数据中的异常检测
文本翻译、摘要或相似性分析
自然语言处理
情绪分析
语音识别或文本转语音
问题回答
开发人员可以将任何受支持的模型上传到 Constellation。他们可以独立训练这些模型,也可以从机器学习中心(例如 HuggingFace 或 ONNX Zoo)下载预先训练好的模型。
然而,并不是每个人都想训练模型或浏览互联网以获取他们尚未测试过的模型。因此,Cloudflare 也将维护一个经过验证和可供使用的模型目录。
我们打造的 Constellation 提供卓越的开发人员体验和易于使用的 API。以下是一个示例,可帮助您开始使用。
图像分类应用程序
在这个例子中,我们将构建一个由 Constellation 推理 API 和 SqueezeNet 模型驱动的图像分类应用程序。SqueezeNet 是一个卷积神经网络(CNN),在开源的 ImageNet 数据库上使用超过 100 万张图像进行预先训练,可将图像分类到不超过 1000 个类别中。
与最早的图像分类 CNN 和基准之一 AlexNet 相比,Constellation 速度要快得多(约 3 倍),体积小得多(约 1/500 ),同时依然达到类似的准确性水平。其小尺寸尤其适合在资源有限的便携式设备或自定义硬件上运行。
首先,让我们使用 ONNX 运行时创建一个新的 Constellation 项目。现在,Wrangler 已经内置 Constellation 相关功能,可以使用 `constellation` 关键字调用。
现在让我们创建包含项目绑定的 wrangler.toml
配置文件:
$ npx wrangler constellation project create "image-classifier" ONNX
安装 Constellation 客户端 API 库:
# Top-level configuration
name = "image-classifier-worker"
main = "src/index.ts"
compatibility_date = "2022-07-12"
constellation = [
{
binding = 'CLASSIFIER',
project_id = '2193053a-af0a-40a6-b757-00fa73908ef6'
},
]
将预训练的 SqueezeNet 1.1 ONNX 模型上传到项目。
$ npm install @cloudflare/constellation --save-dev
如前所述,SqueezeNet 将图像分类到不超过 1000 个对象类别中。这些类别实际上是一组同义词集即 synset 的形式。每个 synset 具有一个 id 和一个标签;它源于普林斯顿大学的 WordNet 数据库术语,也用于标记 ImageNet 图像数据库。
$ wget https://github.com/microsoft/onnxjs-demo/raw/master/docs/squeezenet1_1.onnx
$ npx wrangler constellation model upload "image-classifier" "squeezenet11" squeezenet1_1.onnx
为了将 SqueezeNet 的结果转换为人类可读的图像类别,我们需要一个将 synset ID(从模型获得)映射到对应标签的文件。
最后,让我们编写并部署我们的图像分类脚本。
$ mkdir src; cd src
$ wget https://raw.githubusercontent.com/microsoft/onnxjs-demo/master/src/data/imagenet.ts
这个脚本从请求中读取图像,将其解码为一个多维 float32 张量(目前仅解码 PNG,但我们可以增加其他格式),将其输入到 Constellation 中运行的 SqueezeNet 模型,获取结果,将结果与 ImageNet 类别列表进行匹配,并返回图像的人类可读标签。
import { imagenetClasses } from './imagenet';
import { Tensor, run } from '@cloudflare/constellation';
export interface Env {
CLASSIFIER: any,
}
export default {
async fetch(request: Request, env: Env, ctx: ExecutionContext) {
const formData = await request.formData();
const file = formData.get("file");
const data = await file.arrayBuffer();
const result = await processImage(env, data);
return new Response(JSON.stringify(result));
},
};
async function processImage(env: Env, data: ArrayBuffer) {
const input = await decodeImage(data)
const tensorInput = new Tensor("float32", [1, 3, 224, 224], input)
const output = await run(env.CLASSIFIER, "MODEL-UUID", tensorInput);
const probs = output.squeezenet0_flatten0_reshape0.value
const softmaxResult = softmax(probs)
const results = imagenetClasses(softmaxResult, 5);
const topResult = results[0];
return topResult
}
是不是非常简单?我们测试一下:
可在此看到概率的不同水平。模型对阿尔卑斯山和敞篷车的分类非常确定,但伊比赞猎犬的概率较低。照片中的狗确实是另一个品种。
$ curl https://ai.cloudflare.com/demos/image-classifier -F file=@images/mountain.png | jq .name
alp
$ curl https://ai.cloudflare.com/demos/image-classifier -F file=@images/car.png | jq .name
convertible
$ curl https://ai.cloudflare.com/demos/image-classifier -F file=@images/dog.png | jq .name
Ibizan hound
这个小应用程序演示了,使用机器学习模型和 Constellation 在 Workers 上构建应用程序时是多么容易和快捷。您可以在这里在此处查看完整的源代码并自行部署该应用程序。
变换器
变换器(Transformer) 是由 Google 推出的深度学习模型,旨在处理序列输入数据,常用于自然语言处理(NLP)任务,例如翻译、摘要或情感分析,以及计算机视觉(CV)任务,例如图像分类。
Transformers.js 是一个流行的演示,它从 HuggingFace 加载变换器模型,并在您的浏览器内使用编译为 WebAssembly ONNX Runtime 来运行它们。我们将这个演示移植到使用 Constellation API 来运行。
如下链接打开我们的版本:https://transformers-js.pages.dev/
与 Workers 的互操作性
Constellation 另一个有趣的元素是,由于它原生运行在 Workers 中,您可以将其与我们堆栈中的其他产品和 API 进行编排。您可以使用 KV、R2、D1、Queues 等任何产品,甚至电子邮件。
以下 Worker 示例通过电子邮件路由从您在 Cloudflare 上的域接收电子邮件, 使用 t5-small 情感分析模型运行 Constellation,添加一个带有结果得分的标题,并将其转发到目标地址。
现在,您可以使用 Gmail 或任何电子邮件客户端,根据“X-Sentiment” 标题为您的邮件应用规则。例如,您可能希望在所有愤怒的邮件到达时将其移动到收件箱以外的不同文件夹中。
import { Tensor, run } from '@cloudflare/constellation';
import * as PostalMime from 'postal-mime';
export interface Env {
SENTIMENT: any,
}
export default {
async email(message, env, ctx) {
const rawEmail = await streamToArrayBuffer(event.raw, event.rawSize);
const parser = new PostalMime.default();
const parsedEmail = await parser.parse(rawEmail);
const input = tokenize(parsedEmail.text)
const output = await run( env.SENTIMENT, "MODEL-UUID", input);
var headers = new Headers();
headers.set("X-Sentiment", idToLabel[output.label]);
await message.forward("gooddestination@example.com", headers);
}
}
开始使用 Constellation
Constellation 今天启动内测。如果想加入 Constellation 的等待列表,请前往仪表板,点击账户下的 “Workers” 选项卡,然后点击“请求访问”按钮。我们的团队将分批开通权限,您的帐户获得使用权限后将收到电子邮件通知。
与此同时,您可以阅读我们的 Constellation 开发人员文档 进一步了解其工作原理和 API。Constellation 可以通过 Wrangler 使用,也可以直接在仪表板 UI 中进行管理。Wrangler 是我们的命令行工具,用于配置、构建和部署使用 Cloudflare 开发人员产品的应用程序。
我们非常期待了解您如何在应用程序中使用机器学习/人工智能。Constellation 将不断改进,提供更高的限制、支持更多运行时和更大的模型,但我们希望听取您的意见。您的反馈将对我们的路线图决策产生重要影响。
最后要说的是:今天,我们一直在讨论如何编写使用 Constellation 的 Workers 脚本,但这里有一个关于 Constellation 本身的事实:Constellation 本身就是通过WebAssembly、Workers、R2 和我们的 API 构建的。Workers我们将很快发布一篇后续博客文章,介绍我们是如何构建 Constellation。欢迎继续关注。
一如既往,您可以通过开发人员 Discord (加入 #constellation 频道) 或社区论坛与我们交流;我们的团队将倾听您的声音。