红杉资本:关于AI的一份访谈报告
作者 |MichelleFradin&LaurenReeder来源 |Sequoiacap导语:所有被访
2023-06-19作者| Michelle Fradin & Lauren Reeder
(相关资料图)
65%的公司已经将应用程序投入生产,相比两个月前的50%有所增加,其余的公司仍在进行实验。
94%的公司正在使用基础模型API。在我们的样本中,OpenAI的GPT是明显的首选,占比为91%,然而Anthropic的兴趣在过去的一个季度增长到了15%(有些公司使用多个模型)。
88%的公司认为检索机制,比如向量数据库,将仍然是他们技术栈的关键部分。为模型提供相关上下文以进行推理有助于提高结果的质量,减少“幻觉”(不准确性)并解决数据新鲜度问题。一些公司使用定制的向量数据库(Pinecone、Weaviate、Chroma、Qdrant、Milvus等),而其他公司使用pgvector或AWS的解决方案。
38%的公司对像LangChain这样的LLM编排和应用开发框架很感兴趣。有些公司在原型设计中使用它,而其他公司在生产中使用它。在过去几个月里,采用率有所增加。
不到10%的公司正在寻找监控LLM输出、成本或性能以及A/B测试提示的工具。我们认为随着更多大公司和受监管行业采用语言模型,这些领域的兴趣可能会增加。
少数公司正在研究补充性的生成技术,例如结合生成文本和语音。我们也相信这是一个令人兴奋的增长领域。
15%的公司从头开始或使用开源工具构建定制语言模型,通常是在使用LLM API。几个月前,定制模型训练的需求有所增加。这需要自己的计算、搭建模型库、托管、训练框架、实验跟踪等技术栈,其中包括一些备受喜爱的公司,如Hugging Face、Replicate、Foundry、Tecton、Weights & Biases、PyTorch、Scale等。
我们与每位从业者交谈时都说AI的发展速度太快,无法对最终技术栈有很高的信心,但他们一致认为LLM API将继续是一个关键支柱,其次是检索机制和LangChain类似的开发框架。开源和定制模型训练和调整似乎也在增长。其他领域的技术栈也很重要,但还处于早期阶段。
通用的语言模型很强大,但对于许多用例来说,并不具备差异化或足够的能力。很多公司希望能够在其数据上实现自然语言交互,例如开发者文档、产品库存、人力资源或IT规则等。在某些情况下,这些公司还希望根据用户的数据进行模型定制,比如个人笔记、设计布局、数据指标或代码库。
目前,有三种主要的定制语言模型的方法(有关更深入的技术解释,请参阅Andrej在Microsoft Build上的最新GPT现状演讲):
1)从头开始训练一个定制模型,这也是最困难的方法。
这是解决这个问题的经典和最困难的方式。通常需要高技能的机器学习科学家、大量相关数据、训练基础设施和计算资源。这也是为什么在历史上大部分自然语言处理创新发生在大型科技公司内部的主要原因之一。
BloombergGPT是一个很好的例子,它是一个在大型科技公司之外进行定制模型工作的努力,使用了Hugging Face和其他开源工具资源。随着开源工具的改进和更多公司对LLM进行创新,我们预计会看到更多定制模型和预训练模型的使用。
2)微调基础模型,难度适中。
这是通过使用专有数据或领域特定数据进行额外训练来更新预训练模型的权重。开源创新也使这种方法变得越来越可行,但它通常仍需要一个精通的团队。
一些从业者私下承认,微调比听起来要困难得多,并且可能会产生意想不到的后果,比如模型漂移和在没有预告的情况下“破坏”模型的其他技能。虽然这种方法更有可能变得更普遍,但目前对于大多数公司来说仍然不可行。但同样,这一切正在迅速改变中。
3)使用预训练模型并检索相关上下文,难度最低。
人们通常认为他们希望为自己进行微调的模型,实际上他们只是希望在合适的时候让模型对其信息进行推理。有许多方法可以在适当的时间为模型提供正确的信息:
向SQL数据库进行结构化查询、在产品目录中进行搜索、调用一些外部API或使用嵌入式检索。嵌入式检索的好处是可以使用自然语言轻松搜索非结构化数据。
从技术上讲,这是通过将数据转化为嵌入式向量、将其存储在向量数据库中,在查询发生时搜索这些嵌入式向量以获得最相关的上下文,并将其提供给模型来实现的。
这种方法有助于突破模型的有限上下文窗口,成本更低,解决了数据新鲜度的问题(例如,ChatGPT不了解2021年9月之后的世界),并且可以由单独的开发人员在没有正式机器学习训练的情况下完成。向量数据库在高规模情况下非常有用,它们使存储、搜索和更新嵌入式向量变得更加容易。
到目前为止,我们观察到较大的公司仍在使用他们的企业云协议内的工具,并使用他们云服务提供商的工具,而初创公司倾向于使用专门构建的向量数据库。
然而,这个领域变化非常快速。上下文窗口正在增长(刚刚发布的消息,OpenAI将扩展到16K,而Anthropic推出了10万个令牌的上下文窗口)。基础模型和云数据库可能会直接嵌入检索功能到其服务中。我们将密切关注这个市场的发展。
有时候我们会感觉存在两个技术栈:利用LLM API的技术栈(更多是闭源的,面向开发人员)与训练定制语言模型的技术栈(更多是开源的,历史上面向更复杂的机器学习团队)。一些人纳闷,LLM通过API的可用性是否意味着公司会减少自己的定制训练。到目前为止,我们看到的情况恰恰相反。
随着对AI的兴趣增加和开源开发的加速,许多公司对训练和微调自己的模型越来越感兴趣。我们认为LLM API和定制模型的技术栈将随着时间的推移越来越融合。例如,一家公司可能从开源中训练自己的语言模型,但通过向量数据库进行检索来解决数据新鲜度的问题。为定制模型技术栈构建工具的智能初创公司也在努力扩展其产品,使其与LLM API的革命更相关。
语言模型API将强大的现成模型交到了普通开发人员手中,而不仅仅是机器学习团队。现在,使用语言模型的人群已经显著扩大到所有开发人员,我们相信会看到更多面向开发人员的工具。
例如,LangChain通过抽象常见的问题,帮助开发人员构建LLM应用程序:将模型组合成更高级的系统,将多个模型调用链接在一起,将模型与工具和数据源连接起来,构建可以操作这些工具的代理,并通过简化切换语言模型,帮助避免供应商锁定。有些人在原型设计中使用LangChain,而其他人则继续在生产环境中使用它。
在将LLM完全应用于他们的应用程序之前,许多公司希望有更好的工具来处理数据隐私、隔离、安全性、版权以及监控模型输出。从金融科技到医疗保健的受监管行业的公司尤其关注这一点。报告称很难找到解决这个问题的软件解决方案(这是创业者的一个潜在领域)。
理想情况下,会有软件来警告(如果不是阻止)模型生成错误/幻觉、歧视性内容、危险内容或其他问题。
一些公司还担心与模型共享的数据被用于训练:例如,很少有人了解到ChatGPT Consumer数据默认用于训练,而ChatGPT Business和API数据则不用于训练。随着政策的明确和更多的监管措施的出台,语言模型将获得更多信任,并且我们可能会看到采用率的另一个重大变化。
很多公司已经找到了将多个生成模型结合起来产生巨大效果的有趣方法:结合文本和语音生成的聊天机器人可以实现全新的对话体验。文本和语音模型可以结合使用,帮助您快速修正视频录制中的错误,而无需重新录制整个视频。
模型本身也越来越多元化。我们可以想象未来丰富的消费者和企业AI应用将结合文本、语音/音频和图像/视频生成,以创建更具吸引力的用户体验并完成更复杂的任务。
人工智能正逐渐渗透到技术的方方面面。只有65%的受访公司目前处于生产阶段,而且其中许多应用相对简单。随着越来越多的公司推出LLM应用,新的障碍将出现,为创业者创造更多机会。
未来几年基础设施层将继续快速发展。如果我们看到的演示中只有一半进入生产阶段,我们将迎来一个令人兴奋的未来。看到从最早期的Arc投资到Zoom的创始人们都专注于同一件事情——用人工智能来让用户满意,这真是令人激动。
加入阿尔法工场投资者交流社群 | 添加微信:dlfxs2
标签:
作者 |MichelleFradin&LaurenReeder来源 |Sequoiacap导语:所有被访
2023-06-196月17日,ST海越发布了关于再次延期回复上交所关于公司2022年年报信息
2023-06-19还别说,米娜的这身学生服还是有当年的味道哦!以下图片均由小花猪使用
2023-06-18有关于Calm是一款具有视觉和听觉效果的精美放松应用程序现在一些变化大
2023-06-18扛牢使命担当 勇于改革创新奋力推动湖南湘江新区高质量发展周海兵调研
2023-06-18对于陈雨菲来说,此次卫冕不仅是她的赛季首冠,更是打破了她长达一年的
2023-06-18近日,王宝强自编自导的电影《八角笼中》举行超前点映,网上好评纷纷、
2023-06-18蓝色协议上线一段时间了,还不知道怎么进入官网以及注册账号吗?注册账
2023-06-181、WCA验厂是英国天祥公证行出的一个审核标准,WCA验厂是验社会责任的
2023-06-18大家好,小乐来为大家解答以上的问题。邹北业坦白是哪一集,邹北业出现
2023-06-181、问世的近义词:面世、上市、出版。【问世】:注音:wènshì,释义
2023-06-18关于咖啡厅设计的内容有哪些的内容,包含咖啡厅的设计风格有哪些咖啡厅
2023-06-181、黄斑病变是医学常见疾病,黄斑区是视网膜的一个重要区域,位于眼后
2023-06-18IT之家6月18日消息,特斯拉股价在连续13个交易日上涨后稍事休息了两天
2023-06-18今年6月是第22个全国“安全生产月”。6月17日,常德沅江隧道有限公司联
2023-06-182023年目前为止的仙偶剧仿佛都进入了“烂尾”的怪圈。《星落凝成糖》高
2023-06-18中央气象台今天(18日)6时继续发布高温黄色预警,预计今天白天,
2023-06-181 幸福安康2 快乐成功3 健康长寿4 快乐幸福
2023-06-18本文内容是由小编为大家搜集关于中行jcb,以及中行jcb消费日元怎么还款
2023-06-182场中韩大战冲5冠!向鹏爆冷混双却夺冠,周启豪与世界冠军争雄,向鹏,国
2023-06-186月17日晚8点,第20个京东618高潮期开启,男女装等品类全面爆发。京东6
2023-06-18想想威少与詹姆斯的经历接我痛苦,在如此情况下,哈登的到来,不仅不会
2023-06-186月17日下午,深汕特别合作区鲘门镇海面出现“龙吸水”自然现象,整个
2023-06-181、结局没说陈寻和方茴在一起了,陈寻不知道方茴在哪里,他们很久没有
2023-06-18他或许不善言辞,却总是默默守护;他或许从不说爱你,却给了你全部。“
2023-06-18当日,国际篮联世界女子巡回赛&三人篮球挑战赛(保定站)在保定市马拉
2023-06-181、番茄酱不是孕期禁忌食物。既不会造成胎儿发育异常,也不会流产,所
2023-06-186月17日晚,第25届上海国际电影节金爵奖颁出,日本影片《658公里,阳子
2023-06-181、关于EA橘子平台无法正常登陆问题的解决方案!方法 步骤很多橘子平台
2023-06-18来为大家解答以下的问题,果手机降低系统版本过可以升级吗,苹果手机降
2023-06-18新华社重庆6月17日电(记者伍鲲鹏、梁金雄)17日,中国体育彩票2023“
2023-06-17北仑区气象台2023年6月17日20时39分发布大雾黄色预警信号:目前我区梅
2023-06-17胡歌说《不虚此行》这部电影让他迈过了表演上的一个坎儿。日本电影《65
2023-06-17高温天仍在持续。17日一个白天,北京大学人民医院急诊科接诊了10名出现
2023-06-17被骗网恋对象故意隐瞒结婚有小孩的事,公布我和她的恋爱关系算侵
2023-06-17好消息来了!我们的职工基本养老金今年整体上涨3 8%。听着是不是觉得有
2023-06-17来为大家解答以上问题,苹果4s多少钱一部二手,现在苹果4s多少钱很多人
2023-06-17我找人刷单,但是付款之后却发现跟他说的不一样,我想退款,但是他不退
2023-06-171、一个数如果是另一个整数的完全平方,那么我们就称这个数为完全平方数
2023-06-1701:52记者贺照阳编辑路董萌“技赢未来,能达天下”。6月16日至18日,第
2023-06-171、“淳于焉,就算你能得到我的身体,也休想得到我的心。2、”大雨之夜,
2023-06-171、可以用四个字形容:无法自制如果想进一步了解,我们可以继续交流,
2023-06-17新京报讯(记者张洁)为持续给消费者带来实惠,拼多多百亿补贴联合各大品
2023-06-17刚刚在债务上限危机中惊险“过关”,美国又在酝酿新一轮举债。据美媒近
2023-06-17125的摩托车排量是125CC,125cc是指发动机的气缸容量。125车型有:雅马
2023-06-17“TikTok决心做货架电商。”作者|姚单编辑|刘伟雷峰网独家获悉,TikTok
2023-06-171、海牛兽水+地属性不错,但能力真的不行,速度一大硬伤,做特盾也抗不
2023-06-17作者李语妍编辑袁畅原标题《痛心!私募再现实控人猝然离世!这无法预期
2023-06-171、对于腰椎间盘突出引起的坐骨神经痛,首先应积极睡硬板床,避免长时
2023-06-17在今年的粤港澳大湾区车展上,2023款长城越野炮和火炮两款皮卡正式上市
2023-06-17沪苏轨交11号线“牵手”开启试乘---昨天,苏州轨交11号线花桥站迎来不
2023-06-17家里的小烤箱可以做蛋糕!1烘焙过程中经常用锡纸和油纸,很多新手分不
2023-06-17科技、数码、互联网新闻如今都成为了大众所关注的热点了,因为在我们的
2023-06-17一剂钩虫能否为炎症性肠病患者提供无药物替代品?马拉汉研究所的钩虫治
2023-06-17“这儿有冰镇的酸梅汤和凉茶,您喝一杯凉快凉快,也歇歇脚!”昨天,我
2023-06-17作者昔日现代人快节奏的生活方式容易使人发怒,引发焦虑不安等精神问题
2023-06-176月16日北向资金减持108 18万股乐普医疗。近5个交易日中,获北向资金减
2023-06-17川观新闻记者高敬自建房涉及到的拆除搬离、年久失修等安全问题,一直是
2023-06-17在认真听取新能源汽车产业园区相关情况汇报后,王旭东对新能源汽车产业
2023-06-176月16日北向资金增持747 15万股歌尔股份。近5个交易日中,获北向资金增
2023-06-17n戴维·布莱尔在全球化智库新书发布会上发言 n海外网6月14日电英国
2023-06-17对于大部分的人来说,游戏机都是挂着显示器或者电视游玩,基本上不会考
2023-06-17可以去联想的商城,就在“了解产品”中野迅,也可以通过招商银行分期付
2023-06-17截至2023年6月16日收盘,网达软件(603189)报收于16 18元,上涨1 38%,
2023-06-17本报记者 董红艳 李贝贝 北京报道经历了第一季度的几波行情之后,武
2023-06-16南方财经6月16日电,光通信板块走出探底回升行情,博创科技大涨超10%,
2023-06-16【普京:俄中超80%贸易结算使用卢布和人民币对外贸易中的本币使用进展
2023-06-166月16日晚,深圳地铁14号线岗厦北至沙田方向发生延误。深圳地铁客服人
2023-06-16李世民让臣子报乳名取乐,将军报出乳名后,李世民:原来是你!,李世民
2023-06-165 33周后停止服用钙片:临产前最后一个月最好停止服用钙片,但可以随食
2023-06-16中国车市卷卷卷,这也是好事,价格大战打起来,消费者有了更多选择权。
2023-06-16人到中年回到家乡,与变换身份的妈妈“再相逢”,会发生怎样的故事?在
2023-06-16今日,14个行业获主力资金净流入。证券时报·数据宝统计,6月16日,沪
2023-06-16恒洁汇橱柜冯工的故事始于2007年。当时,他在进行项目施工时发现许多业
2023-06-16国务院发布同意阿克苏阿拉尔高新技术产业开发区升级为国家高新技术产业
2023-06-16Xbox游戏工作室负责人MattBooty近日在接受外媒Axios采访时,透露Xbox内
2023-06-16你们好,最近小未来发现有诸多的小伙伴们对于胡豆的家常做法,胡豆的做
2023-06-166月16日,2023年全国新能源汽车下乡启动仪式在江苏无锡惠山盛大召开,
2023-06-16远东铜箔(宜宾)有限公司就30000吨铜箔项目机加工设备进行邀请招标,
2023-06-16【张朝阳谈AI效应:未来搜狐新闻客户端的摘要将由ChatGPT来写】日前搜
2023-06-16宸展光电(SZ003019,收盘价:20 33元)6月16日晚间发布公告称,公司审
2023-06-16据央行网站消息,央行等五部门印发《关于金融支持全面推进乡村振兴加快
2023-06-16为持续深化合作生态,促进企业高质量发展,日前,菜鸟集团副总裁、国内
2023-06-16截至2023年6月16日收盘,通化东宝(600867)报收于10 26元,下跌0 97%,
2023-06-166月16日,据南宁理工学院:近日,一则“6月3日晚10点,南宁理工学院一
2023-06-16截至2023年6月16日收盘,中油工程(600339)报收于4 0元,上涨3 63%,换
2023-06-16直播吧6月16日讯步行者球员哈利伯顿已经完成了他的第三个NBA赛季,22-2
2023-06-16据共同社,围绕智能手机的应用商店,日本政府6月16日在数字市场竞争会
2023-06-16点击上方“码农突围”,马上关注这里是码农充电第一站,回复“666”,
2023-06-16创指半日涨0 52%,国资云板块多股涨停,个股,创指,涨停股,创业板,深桑达
2023-06-161、《霸道少爷恋上我》、《真的是恶魔呦》、《恋爱100圈》、《恶魔殿下
2023-06-16一代资深艺人正在挨个跟时代告别。今天又走了一位TVB的老戏骨。依然和
2023-06-166月16日消息,亚马逊美国站发布公告称,自2023年7月5日起,新产品listi
2023-06-16盘点课本上没有的知识,收藏起来,大人,小孩一起看,不光是增长见
2023-06-166月15日,内蒙古赤峰市阿鲁科尔沁旗。牧民们赶着牛羊,浩浩荡荡地转场
2023-06-16房地产板块震荡走强,华联控股涨停,沙河股份、万通发展涨超5%,城建发
2023-06-16*云赛智联:松下微波炉40%股权转让项目过程依法合规
2023-06-161、首先把打印机设置成共享。2、再另一台机添加共享打印机。3、设置好I
2023-06-16人民网长沙6月16日电(记者刘宾)6月15日,第三届中非经贸博览会市场化
2023-06-16Copyright © 2015-2022 海峡水产网版权所有 备案号:皖ICP备2022009963号-10 联系邮箱:396 029 142 @qq.com