{"code":20000,"message":"OK","data":{"asset_tags":null,"audio":{"title":""},"audio_info":{"uri":"https://wpimg-wscn.awtmt.com/2ec54a66-4bf8-400d-a031-3e7ad58503c8.mp3","start_time":"0.000000","duration":"391.392000","size":"1174221"},"audio_uri":"https://wpimg-wscn.awtmt.com/2ec54a66-4bf8-400d-a031-3e7ad58503c8.mp3","author":{"article_count":521,"author_kind":"default","avatar":"https://wpimg-wscn.awtmt.com/801d1454-4b80-463f-98e9-3263eaeeb6cd","bio":"  ","display_name":"陈晨","editor_choice_articles":[],"followers_count":759,"id":120000004477,"is_followed":false,"uri":"https://wallstreetcn.com/authors/120000004477"},"categories":[{"key":"global","name":"见闻首页"},{"key":"internal","name":"屏蔽外部"},{"key":"technology","name":"科技"},{"key":"wscn-platform","name":"见闻"},{"key":"tech-platform","name":""}],"columns":[],"comment_count":2,"comment_disabled":false,"content":"\u003cp\u003e4月22日，向量数据库平台（vector database）Weaviate宣布获得5000万美元（约3.5亿元）B轮融资，由Index Ventures领投，Battery Ventures等跟投。\u003c/p\u003e\n\u003cp\u003e4月28日，向量数据库平台Pinecone宣布获得1亿美元（约7亿元）B轮融资，由Andreessen Horowitz领投，ICONIQ Growth等跟投。\u003c/p\u003e\n\u003cp\u003e最近，为ChatGPT等生成式AI应用提供向量搜索、向量数据存储、向量嵌入等功能的向量数据库赛道突然走红，两家初创公司Pinecone和Weaviate的融资时间仅间隔6天，其火爆程度可见一斑。\u003c/p\u003e\n\u003cp\u003ePinecone联合创始人兼首席执行官Edo Liberty则直言，如果没有ChatGPT的出现，我们根本不可能获得巨额融资。\u003c/p\u003e\n\u003cp\u003e事实上，在ChatGPT火爆出圈之前向量数据库非常小众，而Pinecone和Weaviate皆创立于2019年无论是融资还是营收并不如意，因为，大型科技巨头具备自研能力无需使用第三方产品，例如，微软将向量搜索技术应用在Bing中。\u003c/p\u003e\n\u003cp\u003e现在，大量开发者涌向生成式AI应用开发领域，这使得蛰伏4年的两家向量数据库厂商终于迎来了曙光，其用户数量呈指数级增长，也是获得巨额投资的重要原因之一。\u003c/p\u003e\n\u003cfigure\u003e\u003cimg class=\" wscnph\" src=\"https://wpimg-wscn.awtmt.com/76287885-2002-40eb-a486-924da3efb634.png\" data-wscntype=\"image\" data-wscnh=\"292\" data-wscnw=\"865\" /\u003e\n\u003cfigcaption class=\"wscn-img-desc\"\u003ePinecone融资信息\u003c/figcaption\u003e\n\u003c/figure\u003e\n\u003cp\u003e当创业者的目光聚焦在类ChatGPT大语言模型、应用、衍生产品时，为其提供“后勤服务”的向量数据库拓宽了生成式AI细分创业赛道，并成为下一代生成式AI应用的主要数据库存储。\u003c/p\u003e\n\u003cp\u003e不过，目前向量数据库存储只有大型科技巨头才能使用，而Pinecone和Weaviate希望简化使用流程降低成本，使得中小型企业、个人开发者也能使用向量数据库。\u003c/p\u003e\n\u003cp\u003e\u003cimg class=\"wscnph editor-placeholder\" src=\"https://wdl-wscn.awtmt.com/07aeb3e7-f4ca-4207-befb-c987b3dc7011\" data-wscntype=\"video\" data-uri=\"https://streaming-wscn.awtmt.com/cac2c5d6-fced-41db-84b2-fb566f05e9fa_hls.m3u8\" data-cover-img-uri=\"https://wpimg-wscn.awtmt.com/7bcbe482-aaa1-4a88-a9ff-ac88c30680b3.png\" data-title=\"微软专家介绍向量搜索\" data-show-global=\"true\" data-width=\"1920\" data-height=\"1080\" data-duration=\"157.167\" data-size=\"1513\" /\u003e\u003c/p\u003e\n\u003cp style=\"text-align: center;\"\u003e\u003cspan style=\"color: #808080;\"\u003e微软专家介绍向量搜索\u003c/span\u003e\u003c/p\u003e\n\u003cp\u003e此外，根据 IDC调查数据显示，全球在AI技术和服务上的支出2023年将达到1540亿美元，到2026年将超过3000亿美元。其中，向量数据库为AI的开发、增强内容生成的准确性提供了重要技术支撑。\u003c/p\u003e\n\u003cp\u003e下面「AIGC开放社区」将为大家介绍向量数据库技术概念、与ChatGPT等大语言模型的关系、技术特征、场景化落地以及Pinecone和Weaviate这两家典型厂商的介绍。\u003c/p\u003e\n\u003cp\u003e\u003cimg class=\" wscnph\" src=\"https://wpimg-wscn.awtmt.com/81a3d4ae-69c8-48eb-98d9-449ebe2cc635.png\" data-wscntype=\"image\" data-wscnh=\"394\" data-wscnw=\"865\" /\u003e\u003c/p\u003e\n\u003ch2\u003e什么是向量数据库\u003c/h2\u003e\n\u003cp\u003e笔者查询了国外大量权威的论文、专业技术网站，甚至询问了ChatGPT，它们对向量数据库的技术概念解释非常复杂难以理解。所以，就用通俗易懂的方式为大家介绍向量数据库概念。\u003c/p\u003e\n\u003cp\u003e\u003cimg class=\" wscnph\" src=\"https://wpimg-wscn.awtmt.com/3d683336-a04f-44a0-8523-f7241baa476e.png\" data-wscntype=\"image\" data-wscnh=\"470\" data-wscnw=\"865\" /\u003e\u003c/p\u003e\n\u003cp\u003e简单来说，\u003cstrong\u003e向量数据库用来存储非结构化数据，例如，文档、图片、视频、音频和纯文本等，在保证100%信息完整的情况下，通过向量嵌入函数来精准描写这些非结构化数据的特征\u003c/strong\u003e，从而提供查询、删除、修改、元数据过滤等操作。而像SQL、Mysql这样传统的数据库根本无法完成这些操作。\u003c/p\u003e\n\u003cp\u003e从向量数据库的技术特性不难看出，这是专门为ChatGPT等生成式AI应用量身定制，例如，让ChatGPT用莎士比亚的语气生成一段诗句，ChatGPT通过向量数据库的相似搜索功能，可以增强内容输出的准确性。\u003c/p\u003e\n\u003cp\u003e\u003cimg class=\" wscnph\" src=\"https://wpimg-wscn.awtmt.com/472c792f-2a3d-4199-ba7b-c229742fe32a.png\" data-wscntype=\"image\" data-wscnh=\"282\" data-wscnw=\"865\" /\u003e\u003c/p\u003e\n\u003cp\u003e因此，向量数据库在大语言模型、计算机视觉、推荐系统以及其他需要语义理解和数据匹配的领域得到广泛应用。\u003c/p\u003e\n\u003ch2\u003e向量数据库主要功能和用例\u003c/h2\u003e\n\u003cp\u003e向量数据库除了存储数据之外，还提供了语义搜索、图像/音频/视频/等非结构化数据相似度搜索、排名和推荐引擎、支持大规模数据、索引与压缩技术、分布式架构等功能。\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e语义搜索：\u003c/strong\u003e通常搜索文本和文档可以用两种方式完成，词法搜索和精准的单词或字符串匹配。向量数据库的语义搜索可以理解文本、句子和整个文档字符串的含义和上下文，从而提供更准确和相关的搜索结果。\u003c/p\u003e\n\u003cp\u003e\u003cimg class=\" wscnph\" src=\"https://wpimg-wscn.awtmt.com/6b9dfda3-3f78-4e55-89a2-4862e074a621.png\" data-wscntype=\"image\" data-wscnh=\"604\" data-wscnw=\"865\" /\u003e\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e图像/音频/视频/等非结构化数据相似度搜索：\u003c/strong\u003e图像、音频、视频和其他非结构化数据集，在传统数据库中进行分类存储非常具有挑战性，通常需要将关键字、描述和元数据手动应用于每个对象。\u003c/p\u003e\n\u003cp\u003e向量数据库的相似性搜索功能，如余弦相似性、欧氏距离等度量来衡量向量间的相似性。这使得用户在处理如图像识别、推荐系统等变得非常高效。\u003c/p\u003e\n\u003cp\u003e\u003cimg class=\" wscnph\" src=\"https://wpimg-wscn.awtmt.com/3fae697a-355d-4772-85d9-cae8a49afdf4.png\" data-wscntype=\"image\" data-wscnh=\"478\" data-wscnw=\"865\" /\u003e\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e排名和推荐引擎：\u003c/strong\u003e该功能对于电商、搜索引擎来说非常有用，例如，微软的Bing，网易云音乐的推荐都应用了该技术。该功能主要基于用户最近匹配项查找相似项目，使向量数据库为用户提供相关的最佳内容选择，并且可以根据相似性分数对项目进行排名。\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e支持大规模数据：\u003c/strong\u003e向量数据库具有良好的扩展性，能够支持大规模的向量数据存储和检索。这对于处理海量数据的大语言模型、机器学习、数据科研等非常有用。\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e索引与压缩技术：\u003c/strong\u003e为了提高搜索速度和降低存储成本，向量数据库通常采用先进的索引和压缩技术。这些技术可以有效地降低数据的存储空间，提高查询速度，并降低内存占用。\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e分布式架构：\u003c/strong\u003e为了实现高可用性和容错能力，向量数据库采用分布式架构。这使得用户可以在多个计算节点上分布存储和处理数据，提高系统的整体性能。\u003c/p\u003e\n\u003ch2\u003ePinecone和Weaviate简单介绍\u003c/h2\u003e\n\u003cp\u003e根据公开资料显示，Pinecone创立于2019年总部位于美国纽约，主要提供向量数据库服务。Pinecone曾在2021年1月27日，获得1000万美元种子轮融资；2022年3月29日获得2800万美元A轮融资。开发者通过API就能轻松将向量搜索功能添加到应用程序中。官网地址：\u003ca href=\"https://www.pinecone.io/\"\u003ehttps://www.pinecone.io/\u003c/a\u003e\u003c/p\u003e\n\u003cp\u003e\u003cimg class=\" wscnph\" src=\"https://wpimg-wscn.awtmt.com/bc7c5dd3-ab0f-4f16-89da-b0f42775581d.png\" data-wscntype=\"image\" data-wscnh=\"311\" data-wscnw=\"865\" /\u003e\u003c/p\u003e\n\u003cp\u003eWeaviate创立于2019年总部位于荷兰阿姆斯特丹，是一家开源向量数据库服务商。Weaviate主要提供的服务包括：向量搜索、混合搜索、生成搜索等服务。开源地址：\u003ca href=\"https://github.com/weaviate/weaviate\"\u003ehttps://github.com/weaviate/weaviate\u003c/a\u003e\u003c/p\u003e\n\u003cp\u003e\u003cimg class=\" wscnph\" src=\"https://wpimg-wscn.awtmt.com/a9db42a4-59a7-431a-9109-29fbcb975019.png\" data-wscntype=\"image\" data-wscnh=\"370\" data-wscnw=\"865\" /\u003e\u003c/p\u003e\n\u003cp\u003e\u003cspan style=\"color: #808080;\"\u003e本文来源： \u003cspan id=\"profileBt\"\u003e\u003ca style=\"color: #808080;\" href=\"https://mp.weixin.qq.com/s?__biz=Mzg3Mzg5MjY3Nw==\u0026amp;mid=2247488013\u0026amp;idx=1\u0026amp;sn=66aa7ef221483b105028a7f1fa96e92f\u0026amp;chksm=ced84c27f9afc53117456b70beeacb2e6758333425316482ccc1f3787bcc3e659d5532a5805a\u0026amp;mpshare=1\u0026amp;scene=23\u0026amp;srcid=0501tz0AkrVP9PWN5hViOFAn\u0026amp;sharer_sharetime=1682900951123\u0026amp;sharer_shareid=00a55b671777cf0e253d4693000ead51#rd\" target=\"_blank\" rel=\"noopener\"\u003eAIGC开放社区\u003c/a\u003e，原标题：《ChatGPT引爆「向量数据库」赛道！两家公司共获10亿元融资》\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cdiv style=\"color: #666; margin-bottom: 15px;\"\u003e风险提示及免责条款\u003c/div\u003e\n          \u003cdiv style=\"font-size: 12px;font-family: 黑体;color: #666;line-height: 20px;\"\u003e\n            市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。\n          \u003c/div\u003e\n","content_short":"当创业者的目光聚焦在类ChatGPT大语言模型、应用、衍生产品时，为其提供“后勤服务”的向量数据库拓宽了生成式AI细分创业赛道，并成为下一代生成式AI应用的主要数据库存储。","custom_tag":"","display_time":1682903547,"funds":null,"has_transfer_audio":true,"id":3687799,"image":{"uri":"https://wpimg-wscn.awtmt.com/026ec8cd-06f4-4e5f-8924-90562431790e.jpeg","height":575,"width":752,"size":38050},"images":[{"uri":"https://wpimg-wscn.awtmt.com/content_default_15.jpg","height":576,"width":1024,"size":658421}],"influence_score":0,"is_need_pay":false,"is_priced":false,"is_trial":false,"is_video":true,"layout":"wscn-layout","limited_time":0,"membership_uri":"","next":{"id":3687800,"image":{"uri":"https://wpimg-wscn.awtmt.com/3c453341-f146-4f8a-93bf-b63c9811053d.jpeg","height":594,"width":704,"size":115901},"title":"芯片寒冬！韩国四月出口持续低迷，一季度对华出口重挫，程度“无出其右”","url":"https://wallstreetcn.com/articles/3687800"},"pageviews":13213,"plates":[],"previous":{"id":3687798,"image":{"uri":"https://wpimg-wscn.awtmt.com/content_default_18.jpg","height":1667,"width":2500,"size":3806677},"title":"宏观环境仍利于TMT和利率债—兼评4月PMI下跌","url":"https://wallstreetcn.com/articles/3687798"},"related_topics":[],"show_like":true,"source_name":"AIGC开放社区","source_uri":"","subtitle":"","tags":[{"key":"video","name":"视频"}],"theme_group_map":null,"themes":[],"title":"ChatGPT引爆「向量数据库」赛道！两家公司共获10亿元融资","unshow_content_short":false,"words_count":1732}}
