构建企业LLM的机器学习运营框架

  一旦这些组件到位,更复杂的法学硕士(LLM)挑战将需要细致入微的方法和考虑,包括基础设施、能力、风险缓解和人才。 LLM的后端部署   使用传统机器学习(ML)模型进行...

构建企业LLM的机器学习运营框架
(图片来源网络,侵删)

  一旦这些组件到位,更复杂的法学硕士(LLM)挑战将需要细致入微的方法和考虑,包括基础设施、能力、风险缓解和人才。

LLM的后端部署

  使用传统机器学习(ML)模型进行推理通常涉及将模型对象打包为容器,并将其部署在推理服务器上。随着对模型需求的增加——更多的请求和客户需要更多的运行时决策(在延迟范围内更高的每秒查询数QPS)——扩展模型的方式仅需添加更多的容器和服务器。在大多数企业环境中,CPU能够很好地处理传统模型的推理。然而,托管LLM的过程则复杂得多,需要额外的考虑。

  LLM由符号组成——即词的基本单位,模型利用这些符号生成类似人类的语言。它们通常基于先前生成的标记,以自回归的方式逐个标记进行预测,直到达到一个停止词。这个过程可能会变得相当复杂:标记化的方式因模型、任务、语言和计算资源而异。因此,负责部署LLM的工程师不仅需要具备基础设施经验,例如在云中部署容器,还需了解最新技术,以保持推理成本可控并满足性能服务水平协议(SLA)。

向量数据库作为知识库

  在企业环境中部署LLM意味着必须建立向量数据库和其他知识库,并确保它们与文档存储库和语言模型实时协同工作,以产生合理、与上下文相关且准确的输出。例如,零售商可以利用LLM通过消息传递接口与客户进行对话。该模型需要访问实时业务数据的数据库,以获取有关最近交互、产品目录、对话历史、退货政策、市场促销和客户服务指南的最新信息。这些知识库越来越多地发展为向量数据库,以便通过向量搜索和索引算法快速检索查询。

使用硬件加速器进行培训和微调

  LLM还面临一个额外的挑战:针对特定企业任务进行微调以获得最佳性能。大型企业语言模型可能包含数十亿个参数,这需要比传统ML模型更复杂的方法,包括具有高速网络接口的持久计算集群和用于训练及微调的GPU等硬件加速器。一旦训练完成,这些大型模型还需要多GPU节点进行推理,并启用内存优化和分布式计算。

  为了满足计算需求,组织需要在专门的GPU集群或其他硬件加速器上进行更广泛的投资。这些可编程硬件设备可以定制,以加速特定计算,如矩阵向量运算。公共云基础设施在这些集群的构建中起着重要作用。

新的治理和防护方法

  在模型的整个生命周期中,风险缓解至关重要。可观察性、日志记录和跟踪是MLOps过程的核心组件,有助于监控模型发布后的准确性、性能、数据质量和漂移。这对法学硕士同样重要,但还需考虑额外的基础设施层。

  法学硕士可能会产生“幻觉”,偶尔输出错误的信息。组织需要实施适当的保护措施——例如执行特定格式或策略的控制——以确保LLM在生产环境中返回可接受的响应。传统机器学习模型依赖于定量统计方法进行根本原因分析,以解决模型不准确和生产中的漂移。而对于法学硕士,这一过程更加主观,可能涉及对其输出进行定性评分,并在带有预设护栏的API上运行,以确保得到可接受的答案。

本文来自作者[一只昆锐呀]投稿,不代表涵宇网立场,如若转载,请注明出处:http://nanjingyiyao.com/wiki/202409-951.html

(3)

文章推荐

  • 乌克兰总统泽伦斯基呼吁全球团结,共同应对恐怖主义威胁

    (图片来源网络,侵删)  基辅:周六,乌克兰总统泽连斯基呼吁全球领导人团结一致,支持以色列及其他国家,谴责巴勒斯坦伊斯兰组织哈马斯的“恐怖袭击”。  哈马斯的突然袭击导致200多人遇难,成为以色列半个世纪以来最致命的暴力事件。以色列总理内塔尼亚胡誓言将进行“强有力的报复”。  泽连斯基指出

    2024年09月17日
    6
  • 洛杉矶周边数百家庭因海岸缓慢滑坡而断电

    (图片来源网络,侵删)  由于缓慢的山体滑坡,洛杉矶沿海郊区兰乔·帕洛斯·弗迪斯的数百户家庭失去了电力,导致几所房屋被认为不适合居住。  据美国全国广播公司洛杉矶报道,周二下午,加州州长加文·纽森(民主党)宣布该社区进入紧急状态。去年,该地区曾发生过类似事件,10所房屋跌入峡谷,部分居民在收到疏

    2024年09月17日
    3
  • 星露谷的夏威夷庆典全攻略

    (图片来源网络,侵删)  在《星露谷物语》中,除了农业和采矿等多样化活动,游戏还通过许多特殊事件增强了互动性和吸引力。从季节性节日到居民的生日庆祝,玩家每个月都有机会与鹈鹕镇的居民参与各种有趣的活动,从而在游戏中建立有益的关系。  在每个节日开始之前,市长刘易斯会提前向玩家发送一封信,告知节日的

    2024年09月19日
    2
  • YouTube探索短视频与长视频的融合之路

    (图片来源网络,侵删)  YouTube正在尝试将较长的视频片段整合到其广受欢迎的短视频(Shorts)流中,以利用这一格式的成功。尽管这一举措看似矛盾,其目的是最大化所有内容类型的收视率,借助《今日社交媒体》网站报道的《Shorts》每天700亿的浏览量。  该平台解释称:“为了帮助观众更好地

    2024年09月19日
    2
  • 南非人参与投票,标志着30年来最具历史意义的选举

    (图片来源网络,侵删)  南非人开始在选举中投票,这被视为该国30年来最重要的一次选举,可能将其年轻的民主置于未知的领域。非洲人国民大会党(ANC)自1994年领导南非摆脱种族隔离制度以来,执政三十年的局面岌岌可危。  在这个拥有6200万人口的国家中,新一代的不满情绪日益高涨,估计有一半人口生

    2024年09月20日
    4
  • 意大利总理因欧盟选举胜利赢得国内外广泛支持

    (图片来源网络,侵删)  意大利总理乔治娅·梅洛尼(GiorgiaMeloni)领导的极右翼政党在意大利举行的欧洲议会选举中赢得了28%的选票,进一步巩固了她在国内的领导地位,并提升了她在欧洲的影响力。  根据意大利国家广播公司(RAI)基于近70%的计票结果的预测,梅洛尼的意大利兄弟党(Br

    2024年09月20日
    4
  • 皇家防止虐待动物协会从塔斯马尼亚拉布拉多犬饲养员处救助的剩余狗狗成功找到新家

    简要概述(图片来源网络,侵删)  上个月,在与皇家防止虐待动物协会(RSPCA)达成庭外协议后,从塔斯马尼亚饲养场救出的239只狗中的最后28只正在进行重新安置。这些狗经过精心护理和理发,准备交给新主人和寄养人员。后续行动  RSPCA表示,他们希望采取紧急措施,禁止养狗场,对饲养者进行

    2024年09月20日
    3
  • 调查显示教官在训练时误认为手枪无子弹便开火

    (图片来源网络,侵删)  根据受害者家属公布的调查记录,在四月份的一次训练中,一名枪支教官未能确保他的枪是空的,导致他向监狱部门官员开了一枪,造成了致命伤害。  根据俄亥俄州高速公路巡警的报告,这名教练当时正站在兰迪·奥斯本中尉面前,给他额外的指示,但意外扣动了扳机,正好击中了奥斯本的防护背心上

    2024年09月21日
    1
  • 首版罗伯特·彭斯诗集预计将拍卖至6万英镑

    (图片来源网络,侵删)  一本罕见的第一版罗伯特·彭斯诗集将于本月晚些时候拍卖,预计售价高达6万英镑。这本珍贵的作品于1786年由基尔马诺克的一家印刷商首次出版,主要以苏格兰方言创作的诗歌将于9月19日星期四在里昂和特恩布尔的在线图书和手稿拍卖会上出售。  拍卖商称这本诗集是苏格兰文学中最重要的

    2024年09月21日
    1
  • 梅根·马克尔惹怒大明星,或将面临被拉下台的风险

    (图片来源网络,侵删)  哈里王子和梅根·马克尔不再受王室高级成员必须遵守的规则的约束,但这对夫妇在离开王室后并未一帆风顺。  自退出王室以来,苏塞克斯公爵和公爵夫人尝试了多种新业务,包括与Spotify合作创建播客和与Netflix合作制作纪录片系列。最近,梅根还涉足奢侈生活方式品牌,推出了名

    2024年09月21日
    3

发表回复

本站作者后才能评论

评论列表(4条)

  • 一只昆锐呀
    一只昆锐呀 2024年09月19日

    我是涵宇网的签约作者“一只昆锐呀”!

  • 一只昆锐呀
    一只昆锐呀 2024年09月19日

    希望本篇文章《构建企业LLM的机器学习运营框架》能对你有所帮助!

  • 一只昆锐呀
    一只昆锐呀 2024年09月19日

    本站[涵宇网]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 一只昆锐呀
    一只昆锐呀 2024年09月19日

    本文概览:  一旦这些组件到位,更复杂的法学硕士(LLM)挑战将需要细致入微的方法和考虑,包括基础设施、能力、风险缓解和人才。 LLM的后端部署   使用传统机器学习(ML)模型进行...

    联系我们

    邮件:涵宇网@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们