”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 在 Fastly 上使用 AI 构建“为您”推荐!

在 Fastly 上使用 AI 构建“为您”推荐!

发布于2024-11-08
浏览:492

忘记炒作;人工智能在哪里创造真正的价值?让我们利用边缘计算来利用人工智能的力量,打造快速、安全、可靠的智能用户体验。

推荐无处不在,每个人都知道,使网络体验更加个性化可以使其更具吸引力和成功。 我的亚马逊主页知道我喜欢家居用品、厨具,现在还喜欢夏季服装:

Build \

如今,大多数平台都让您在快速或个性化之间做出选择。在 Fastly,我们认为您和您的用户应该同时拥有两者。 如果每次您的网络服务器生成一个页面,它只适合一个最终用户,您就无法从缓存中受益,而这正是像 Fastly 这样的边缘网络所擅长的。

那么,如何从边缘缓存中受益,同时使内容个性化? 我们之前写过很多关于如何将复杂的客户端请求分解为多个较小的、可缓存的后端请求的文章,您可以在我们的开发人员中心的个性化主题中找到教程、代码示例和演示。

但是,如果您想更进一步并在边缘生成个性化数据怎么办? “边缘”——处理您网站流量的 Fastly 服务器,是距离最终用户最近的点,且仍在您的控制范围内。一个制作特定于某个用户的内容的好地方。

“为你”用例

产品推荐本质上是短暂的,特定于单个用户,并且可能经常变化。 但它们也不需要持续存在——我们通常不需要知道我们向每个人推荐了什么,只需要知道特定算法是否比其他算法实现了更好的转换。 一些推荐算法需要访问大量状态数据,例如哪些用户与您最相似以及他们的购买或评分历史记录,但通常这些数据很容易批量预生成。

基本上,生成推荐通常不会创建事务,不需要数据存储中的任何锁,并利用可从当前用户会话立即可用或在离线构建过程中创建的输入数据。

听起来我们可以在边缘生成推荐!

一个现实世界的例子

我们来看看纽约大都会艺术博物馆的网站:

Build \

大都会博物馆收藏的 500,000 件左右的藏品中,每一件都有一个页面,其中包含图片和相关信息。 它还具有相关对象的列表:

Build \

这似乎使用了相当简单的分面系统来生成这些关系,向我展示同一艺术家的其他艺术品,或博物馆同一翼中的其他物体,或者也是由纸制成或起源于同一翼的其他物体。时间段。

这个系统的好处(从开发人员的角度来看!)是因为它仅基于一个输入对象,所以它可以预先生成到页面中。

如果我们想通过基于最终用户浏览大都会网站时的个人浏览历史记录而不仅仅是基于这个对象的一系列推荐来增强这一点,该怎么办?

添加个性化推荐

我们可以通过很多方式做到这一点,但我想尝试使用语言模型,因为人工智能

正在发生,而且它与大都会现有的相关艺术品机制似乎非常不同。工作。 计划如下:

    下载大都会博物馆的开放获取收藏数据集。
  1. 通过语言模型运行它以创建向量嵌入 - 适合机器学习任务的数字列表。
  2. 为生成的 50 万个向量(代表大都会艺术博物馆的艺术品)构建一个高性能相似性搜索引擎,并将其加载到 KV 存储中,以便我们可以从 Fastly Compute 中使用它。
一旦我们完成了所有这些,当您浏览大都会的网站时,我们应该能够:

    在 cookie 中跟踪您访问的艺术品。
  1. 查找这些艺术品对应的向量。
  2. 计算代表您的浏览兴趣的平均向量。
  3. 将其插入我们的相似性搜索引擎以查找最相似的艺术品。
  4. 从 Met 的 Object API 加载有关这些艺术品的详细信息,并通过个性化推荐来增强页面。
瞧,个性化推荐:

Build \

好的,让我们来分解一下。

创建数据集

Met 的原始数据集是一个包含很多列的 CSV,如下所示:


对象编号、是突出显示、是时间线作品、是公共领域、对象 ID、画廊编号、部门、加入年份、对象名称、标题、文化、时期、朝代、统治时期、作品集、成分 ID、艺术家角色、艺术家前缀、艺术家显示名称、艺术家显示简介、艺术家后缀、艺术家 Alpha 排序、艺术家国籍、艺术家开始日期、艺术家结束日期、艺术家性别、艺术家 ULAN URL、艺术家 Wikidata URL、对象日期、对象开始日期、对象结束日期、中、维度、信用额度、地理类型、城市、州、县、国家/地区、地区、子区域、区域设置、地点、挖掘、河流、分类、权利和复制、链接资源、对象 Wikidata URL、元数据日期、存储库、标签、标签AAT URL,标签维基数据 URL 1979.486.1,假,假,假,1,,美国翼,1979 年,硬币,一美元自由头像硬币,,,,,,16429,制造商,“”,詹姆斯·巴顿·朗埃克,“美国,特拉华县,宾夕法尼亚州 1794–1869 宾夕法尼亚州费城"," ","朗埃克, 詹姆斯·巴顿",美国,1794 ,1869 ,,http://vocab.getty.edu/page/ulan/500011409,https://www.wikidata. org/wiki/Q3806459,1853,1853,1853,Gold,尺寸不可用,“Heinz L. Stoppelmann 的礼物,1979 年”,,,,,,,,,,,,,,http://www.metmuseum.org /art/collection/search/1,,,"大都会艺术博物馆,纽约,纽约",,, 1980.264.5,假,假,假,2,,美国之翼,1980,硬币,十美元自由头像硬币,,,,,,107,制造者," ",克里斯蒂安·戈布雷希特,1785–1844," ", “戈布雷希特,克里斯蒂安”,美国,1785 ,1844 ,,http://vocab.getty.edu/page/ulan/500077295,https://www.wikidata.org/wiki/Q5109648,1901,1901,1901,Gold ,尺寸不可用,“Heinz L. Stoppelmann 的礼物, 1980”,,,,,,,,,,,,,,http://www.metmuseum.org/art/collection/search/2,,,“大都会艺术博物馆,纽约,纽约”,,,
Object Number,Is Highlight,Is Timeline Work,Is Public Domain,Object ID,Gallery Number,Department,AccessionYear,Object Name,Title,Culture,Period,Dynasty,Reign,Portfolio,Constituent ID,Artist Role,Artist Prefix,Artist Display Name,Artist Display Bio,Artist Suffix,Artist Alpha Sort,Artist Nationality,Artist Begin Date,Artist End Date,Artist Gender,Artist ULAN URL,Artist Wikidata URL,Object Date,Object Begin Date,Object End Date,Medium,Dimensions,Credit Line,Geography Type,City,State,County,Country,Region,Subregion,Locale,Locus,Excavation,River,Classification,Rights and Reproduction,Link Resource,Object Wikidata URL,Metadata Date,Repository,Tags,Tags AAT URL,Tags Wikidata URL
1979.486.1,False,False,False,1,,The American Wing,1979,Coin,One-dollar Liberty Head Coin,,,,,,16429,Maker," ",James Barton Longacre,"American, Delaware County, Pennsylvania 1794–1869 Philadelphia, Pennsylvania"," ","Longacre, James Barton",American,1794      ,1869      ,,http://vocab.getty.edu/page/ulan/500011409,https://www.wikidata.org/wiki/Q3806459,1853,1853,1853,Gold,Dimensions unavailable,"Gift of Heinz L. Stoppelmann, 1979",,,,,,,,,,,,,,http://www.metmuseum.org/art/collection/search/1,,,"Metropolitan Museum of Art, New York, NY",,,
1980.264.5,False,False,False,2,,The American Wing,1980,Coin,Ten-dollar Liberty Head Coin,,,,,,107,Maker," ",Christian Gobrecht,1785–1844," ","Gobrecht, Christian",American,1785      ,1844      ,,http://vocab.getty.edu/page/ulan/500077295,https://www.wikidata.org/wiki/Q5109648,1901,1901,1901,Gold,Dimensions unavailable,"Gift of Heinz L. Stoppelmann, 1980",,,,,,,,,,,,,,http://www.metmuseum.org/art/collection/search/2,,,"Metropolitan Museum of Art, New York, NY",,,
很简单,可以将其转换为两列,一个 ID 和一个字符串:


id、描述 1、“一美元自由头像硬币;类型:硬币;艺术家:詹姆斯·巴顿·朗埃克;材质:黄金;日期:1853 年;图片来源:Heinz L. Stoppelmann 的礼物,1979 年” 2、“十美元自由头像硬币;类型:硬币;艺术家:克里斯蒂安·戈布雷希特;材质:黄金;日期:1901 年;图片来源:Heinz L. Stoppelmann 的礼物,1980 年” 3、“二元半硬币;类型:硬币;材质:黄金;日期:1927 年;图片来源:C. Ruxton Love Jr. 的礼物,1967 年”
Object Number,Is Highlight,Is Timeline Work,Is Public Domain,Object ID,Gallery Number,Department,AccessionYear,Object Name,Title,Culture,Period,Dynasty,Reign,Portfolio,Constituent ID,Artist Role,Artist Prefix,Artist Display Name,Artist Display Bio,Artist Suffix,Artist Alpha Sort,Artist Nationality,Artist Begin Date,Artist End Date,Artist Gender,Artist ULAN URL,Artist Wikidata URL,Object Date,Object Begin Date,Object End Date,Medium,Dimensions,Credit Line,Geography Type,City,State,County,Country,Region,Subregion,Locale,Locus,Excavation,River,Classification,Rights and Reproduction,Link Resource,Object Wikidata URL,Metadata Date,Repository,Tags,Tags AAT URL,Tags Wikidata URL
1979.486.1,False,False,False,1,,The American Wing,1979,Coin,One-dollar Liberty Head Coin,,,,,,16429,Maker," ",James Barton Longacre,"American, Delaware County, Pennsylvania 1794–1869 Philadelphia, Pennsylvania"," ","Longacre, James Barton",American,1794      ,1869      ,,http://vocab.getty.edu/page/ulan/500011409,https://www.wikidata.org/wiki/Q3806459,1853,1853,1853,Gold,Dimensions unavailable,"Gift of Heinz L. Stoppelmann, 1979",,,,,,,,,,,,,,http://www.metmuseum.org/art/collection/search/1,,,"Metropolitan Museum of Art, New York, NY",,,
1980.264.5,False,False,False,2,,The American Wing,1980,Coin,Ten-dollar Liberty Head Coin,,,,,,107,Maker," ",Christian Gobrecht,1785–1844," ","Gobrecht, Christian",American,1785      ,1844      ,,http://vocab.getty.edu/page/ulan/500077295,https://www.wikidata.org/wiki/Q5109648,1901,1901,1901,Gold,Dimensions unavailable,"Gift of Heinz L. Stoppelmann, 1980",,,,,,,,,,,,,,http://www.metmuseum.org/art/collection/search/2,,,"Metropolitan Museum of Art, New York, NY",,,
现在我们可以使用 Hugging Face AI 工具集中的 Transformers 包,并生成每个描述的嵌入。 我们使用sentence-transformers/all-MiniLM-L12-v2模型,并使用主成分分析(PCA)将结果向量减少到5维。 这会给你类似的东西:


[ { “id”:1, “向量”:[-0.005544120445847511,-0.030924081802368164,0.008597176522016525,0.20186401903629303,0.0578165128827095] }, { “id”:2, “向量”:[-0.005544120445847511,-0.030924081802368164,0.008597176522016525,0.20186401903629303,0.0578165128827095] }, …… ]
Object Number,Is Highlight,Is Timeline Work,Is Public Domain,Object ID,Gallery Number,Department,AccessionYear,Object Name,Title,Culture,Period,Dynasty,Reign,Portfolio,Constituent ID,Artist Role,Artist Prefix,Artist Display Name,Artist Display Bio,Artist Suffix,Artist Alpha Sort,Artist Nationality,Artist Begin Date,Artist End Date,Artist Gender,Artist ULAN URL,Artist Wikidata URL,Object Date,Object Begin Date,Object End Date,Medium,Dimensions,Credit Line,Geography Type,City,State,County,Country,Region,Subregion,Locale,Locus,Excavation,River,Classification,Rights and Reproduction,Link Resource,Object Wikidata URL,Metadata Date,Repository,Tags,Tags AAT URL,Tags Wikidata URL
1979.486.1,False,False,False,1,,The American Wing,1979,Coin,One-dollar Liberty Head Coin,,,,,,16429,Maker," ",James Barton Longacre,"American, Delaware County, Pennsylvania 1794–1869 Philadelphia, Pennsylvania"," ","Longacre, James Barton",American,1794      ,1869      ,,http://vocab.getty.edu/page/ulan/500011409,https://www.wikidata.org/wiki/Q3806459,1853,1853,1853,Gold,Dimensions unavailable,"Gift of Heinz L. Stoppelmann, 1979",,,,,,,,,,,,,,http://www.metmuseum.org/art/collection/search/1,,,"Metropolitan Museum of Art, New York, NY",,,
1980.264.5,False,False,False,2,,The American Wing,1980,Coin,Ten-dollar Liberty Head Coin,,,,,,107,Maker," ",Christian Gobrecht,1785–1844," ","Gobrecht, Christian",American,1785      ,1844      ,,http://vocab.getty.edu/page/ulan/500077295,https://www.wikidata.org/wiki/Q5109648,1901,1901,1901,Gold,Dimensions unavailable,"Gift of Heinz L. Stoppelmann, 1980",,,,,,,,,,,,,,http://www.metmuseum.org/art/collection/search/2,,,"Metropolitan Museum of Art, New York, NY",,,
我们有 50 万个这样的数据集,因此不可能将整个数据集存储在边缘应用程序的内存中。 我们希望对这些数据进行自定义类型的相似性搜索,这是传统键值存储所不提供的。由于我们正在构建实时体验,因此我们也确实希望避免一次搜索 50 万个向量。

那么,让我们对数据进行分区。 我们可以使用 KMeans 聚类对彼此相似的向量进行分组。 我们将数据分成 500 个不同大小的簇,并为每个簇计算一个称为“质心向量”的中心点。 如果您以二维方式绘制此向量空间并放大,它可能看起来有点像这样:

Build \

红十字是每个向量簇的数学中心点,称为质心。它们可以像我们 50 万向量空间的寻路器一样工作。例如,如果我们想找到与给定向量 A 最相似的 10 个向量,我们可以首先寻找最近的质心(在 500 个质心中),然后仅在其相应的簇内进行搜索——这是一个更易于管理的区域!

现在我们有 500 个小数据集和一个将质心点映射到相关数据集的索引。 接下来,为了实现实时性能,我们想要预编译搜索图,这样我们就不需要在运行时初始化和构造它们,并且可以使用尽可能少的CPU时间。 一种非常快速的最近邻算法是分层可导航小世界(HNSW),它有一个纯 Rust 实现,我们用它来编写我们的边缘应用程序。 因此,我们编写了一个小型独立 Rust 应用程序来为每个数据集构建 HNSW 图结构,然后使用 bincode 将实例化结构的内存导出到二进制 blob 中。

现在,这些二进制 blob 可以加载到 KV 存储中,针对集群索引进行键控,并且集群索引可以包含在我们的边缘应用程序中。

这种架构允许我们按需将部分搜索索引加载到内存中。而且由于我们永远不需要一次搜索超过几千个向量,因此我们的搜索将始终廉价且快速。

构建边缘应用程序

我们在边缘运行的应用程序需要处理几种类型的请求:

  • HTML 页面: 我们从 metmuseum.org 获取这些内容并转换响应以添加额外的前端
  • 这些额外标签引用的 Fastly 脚本和样式资源,我们可以直接从边缘应用程序的二进制文件中提供这些资源。
  • 推荐端点,生成并返回推荐 ** 所有其他(非 HTML)请求: 图像以及大都会艺术博物馆自己的脚本和样式表,我们直接从其域代理,无需更改。
我们最初用 JavaScript 构建了这个应用程序,但最终将推荐部分移植到 Rust,因为我们喜欢即时距离的 HNSW 实现。

客户端 JavaScript 做了一些有趣的事情:

    使用 IntersectionObserver,当用户将页面向下滚动到相关对象部分时,我们会触发一个事件。这是一个超级高效的 API,比使用 onscroll 等旧方法要好得多。
  1. 获取我们的特别推荐 API 端点(然后我们可以在边缘处理并返回对象信息)
  2. 使用客户端函数内置的模板编写一些 HTML
  3. 将该 HTML 附加到页面并将交叉观察器移动到新元素,以便当您滚动浏览建议时,我们会继续加载更多内容。
这样,我们可以在不调用我们的推荐算法的情况下提供主要的 HTML 有效负载,但推荐的提供速度足够快,我们可以在您滚动时加载它们,并且当您到达它们时它们几乎肯定会在那里。

我喜欢以这种方式做事,因为尽快向用户提供第一个首屏视图绝对是最重要的。 除非滚动才能看到的任何内容都可以稍后加载,特别是如果它是复杂的个性化内容 - 如果用户不打算滚动,则生成它是没有意义的。

结束语

因此,现在您拥有了两全其美的优势:能够提供高度个性化的内容,几乎不需要对源进行任何阻塞获取,并且优化的 HTML 有效负载可以以令人难以置信的速度呈现,使您的应用程序能够有效地享受无限的可扩展性和接近的性能。完美的弹性。

这不是一个完美的解决方案。 如果 Fastly 提供更多更高级别的功能来通过查询机制而不是简单的键查找来公开边缘数据(让我们知道这是否对您有帮助!),并且这种特定机制有明显的缺陷 - 如果我对以下方面有单独的兴趣两个或更多非常不同的东西(比如19世纪的油画和古罗马双耳瓶)我会得到建议,这将是这些之间的理论语义“中间点”,而不是一个非常有用的结果。

不过,希望这证明了一个原则,即弄清楚如何在边缘工作通常会在可扩展性、性能和弹性方面带来巨大的好处。

让我们知道您在community.fastly.com 上构建了什么!

版本声明 本文转载于:https://dev.to/fastly/build-for-you-recommendations-using-ai-on-fastly-5eap?1如有侵犯,请联系[email protected]删除
最新教程 更多>
  • Java字符串非空且非null的有效检查方法
    Java字符串非空且非null的有效检查方法
    检查字符串是否不是null而不是空的 if(str!= null && str.isementy())二手: if(str!= null && str.length()== 0) option 3:trim()。isement(Isement() trim whitespace whitesp...
    编程 发布于2025-04-30
  • 解决MySQL错误1153:数据包超出'max_allowed_packet'限制
    解决MySQL错误1153:数据包超出'max_allowed_packet'限制
    mysql错误1153:故障排除比“ max_allowed_pa​​cket” bytes 更大的数据包,用于面对阴谋mysql错误1153,同时导入数据capase doft a Database dust?让我们深入研究罪魁祸首并探索解决方案以纠正此问题。理解错误此错误表明在导入过程中接...
    编程 发布于2025-04-30
  • 如何使用Regex在PHP中有效地提取括号内的文本
    如何使用Regex在PHP中有效地提取括号内的文本
    php:在括号内提取文本在处理括号内的文本时,找到最有效的解决方案是必不可少的。一种方法是利用PHP的字符串操作函数,如下所示: 作为替代 $ text ='忽略除此之外的一切(text)'; preg_match('#((。 &&& [Regex使用模式来搜索特...
    编程 发布于2025-04-30
  • 如何使用替换指令在GO MOD中解析模块路径差异?
    如何使用替换指令在GO MOD中解析模块路径差异?
    在使用GO MOD时,在GO MOD 中克服模块路径差异时,可能会遇到冲突,其中可能会遇到一个冲突,其中3派对软件包将另一个带有导入套件的path package the Imptioned package the Imptioned package the Imported tocted pac...
    编程 发布于2025-04-30
  • 编译器报错“usr/bin/ld: cannot find -l”解决方法
    编译器报错“usr/bin/ld: cannot find -l”解决方法
    错误:“ usr/bin/ld:找不到-l “ 此错误表明链接器在链接您的可执行文件时无法找到指定的库。为了解决此问题,我们将深入研究如何指定库路径并将链接引导到正确位置的详细信息。添加库搜索路径的一个可能的原因是,此错误是您的makefile中缺少库搜索路径。要解决它,您可以在链接器命令中添加...
    编程 发布于2025-04-30
  • 将图片浮动到底部右侧并环绕文字的技巧
    将图片浮动到底部右侧并环绕文字的技巧
    在Web设计中围绕在Web设计中,有时可以将图像浮动到页面右下角,从而使文本围绕它缠绕。这可以在有效地展示图像的同时创建一个吸引人的视觉效果。 css位置在右下角,使用css float and clear properties: img { 浮点:对; ...
    编程 发布于2025-04-30
  • 在C#中如何高效重复字符串字符用于缩进?
    在C#中如何高效重复字符串字符用于缩进?
    在基于项目的深度下固定字符串时,重复一个字符串以进行凹痕,很方便有效地有一种有效的方法来返回字符串重复指定的次数的字符串。使用指定的次数。 constructor 这将返回字符串“ -----”。 字符串凹痕= new String(' - ',depth); console.Wr...
    编程 发布于2025-04-30
  • Android如何向PHP服务器发送POST数据?
    Android如何向PHP服务器发送POST数据?
    在android apache httpclient(已弃用) httpclient httpclient = new defaulthttpclient(); httppost httppost = new httppost(“ http://www.yoursite.com/script.p...
    编程 发布于2025-04-30
  • Java为何无法创建泛型数组?
    Java为何无法创建泛型数组?
    通用阵列创建错误 arrayList [2]; JAVA报告了“通用数组创建”错误。为什么不允许这样做?答案:Create an Auxiliary Class:public static ArrayList<myObject>[] a = new ArrayList<myO...
    编程 发布于2025-04-30
  • 哪种方法更有效地用于点 - 填点检测:射线跟踪或matplotlib \的路径contains_points?
    哪种方法更有效地用于点 - 填点检测:射线跟踪或matplotlib \的路径contains_points?
    在Python Matplotlib's path.contains_points FunctionMatplotlib's path.contains_points function employs a path object to represent the polygon.它...
    编程 发布于2025-04-30
  • 在Axios请求中自动包含Cookie的设置方法
    在Axios请求中自动包含Cookie的设置方法
    在Axios请求中自动化cookie包含 在使用AXIOS从客户端向服务器提出请求时,通常需要将cookie发送到这些请求中。在不手动添加它们的情况下,您可能会遇到困难在服务器代码中访问这些cookie,如提供的示例所示,尽管在express.js中使用了cookieparser中间件。启用此属性...
    编程 发布于2025-04-30
  • 如何实时捕获和流媒体以进行聊天机器人命令执行?
    如何实时捕获和流媒体以进行聊天机器人命令执行?
    在开发能够执行命令的chatbots的领域中,实时从命令执行实时捕获Stdout,一个常见的需求是能够检索和显示标准输出(stdout)在cath cath cant cant cant cant cant cant cant cant interfaces in Chate cant inter...
    编程 发布于2025-04-30
  • 可以在纯CS中将多个粘性元素彼此堆叠在一起吗?
    可以在纯CS中将多个粘性元素彼此堆叠在一起吗?
    [2这里: https://webthemez.com/demo/sticky-multi-header-scroll/index.html &lt;/main&gt; &lt;section&gt; { display:grid; grid-template-...
    编程 发布于2025-04-30
  • 如何从PHP中的Unicode字符串中有效地产生对URL友好的sl。
    如何从PHP中的Unicode字符串中有效地产生对URL友好的sl。
    为有效的slug生成首先,该函数用指定的分隔符替换所有非字母或数字字符。此步骤可确保slug遵守URL惯例。随后,它采用ICONV函数将文本简化为us-ascii兼容格式,从而允许更广泛的字符集合兼容性。接下来,该函数使用正则表达式删除了不需要的字符,例如特殊字符和空格。此步骤可确保slug仅包含...
    编程 发布于2025-04-30
  • 在JavaScript中如何获取实际渲染的字体,当CSS字体属性未定义时?
    在JavaScript中如何获取实际渲染的字体,当CSS字体属性未定义时?
    Accessing Actual Rendered Font when Undefined in CSSWhen accessing the font properties of an element, the JavaScript object.style.fontFamily and objec...
    编程 发布于2025-04-30

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3