1. 首页
  2.  » 
  3. 新闻中心
  4.  » 天旦发布OpsGPT,首个运维大语言模型

天旦发布OpsGPT,首个运维大语言模型

by | Jul 17, 2023

日前,国内领先的IT性能管理厂商上海天旦网络科技发展有限公司(以下简称:天旦)正式发布业界首个运维语言模型OpsGPT,为大语言模型在运维领域的应用带来技术落地实例。OpsGPT是一款具备运维专业知识的大语言模型,它能够解答复杂的运维技术知识点并进行推理分析,就像ChatGPT为用户提供各种信息和建议一样。这一创新将通过人工智能为运维工程师在专业技术知识学习、复杂的故障分析等多方面提供智能化的支持。

在大语言模型技术的快速发展中,ChatGPT以其全知全能的回答能力引起了广泛的关注。随后,各行业开始研发自己的语言模型,如BloombergGPT成为首个大型金融语言模型,谷歌的Med-PaLM2模型在医疗领域的测试中达到医疗专家的水平等。在运维领域,天旦决定以研究为目的,开发一款专注于运维领域的大语言模型,以满足运维工程师们借助人工智能高效解决复杂技术问题的需求。

在330亿参数的Pretrain大模型基础上,通过指令微调(finetune)的方式,OpsGPT模型在运维领域的数据和任务上进行训练,覆盖了应用和业务场景,网络协议、流量分析等专业领域知识,使其获得更高的准确率和推导能力。目前,用于训练的高质量运维数据样本已经超过30万条,但受限于数据总量和硬件资源,天旦的OpsGPT会采用低阶适应、迭代发展的模式,逐步进行强化大模型能力。

运维知识加强,让OpsGPT成为运维专家

运维领域是一个专业且严谨的领域,要让通用语言模型在运维领域发挥作用,需要让其具备更专业、更广泛的运维知识。为了持续增强OpsGPT的能力,天旦人工智能团队为其量身制定了一套学习认证计划去掌握各类专业知识。OpsGPT面临的第一个目标,就是通过CCNA考试。CCNA是思科认证的入门级别,主要面向网络技术的初学者和初级网络工程师,涵盖了网络基础知识、路由和交换、无线网络、安全等方面的内容。如果参加2022年的CCNA考试(去除必须依赖图形才能做的题目),OpsGPT的正确率可以达到94.1%,而与之对应的GPT-4能达到78%,ChatGPT(3.5)只能达到59%。CCNA的通过分数为750/1000,即所有题目的75%。因此,如果忽略那些依赖图例的题目,大致可以认为GPT-4和OpsGPT是可以得到CCNA认证的。

在经过训练后Netis OpsGPT的成绩优秀

虽然ChatGPT/GPT-4在提供丰富信息和建议方面表现出色,但在专业知识领域仍然需要更多的专业积累和训练。天旦将积累了十多年在运维领域的知识,应用到OpsGPT模型的训练中,取得初步成效。

逻辑和计算能力加强,让OpsGPT学会严谨推理

除了知识的积累,运维领域更需要严谨的数理推导能力。在模型微调的过程中,OpsGPT背后的天旦人工智能团队也进行了一系列实验:到底能不能让大语言模型具备足够强的计算能力?在训练一段时间后,效果让人振奋。以二进制转换为例,让我们来看一个问题:十进制的数字 87453 转换为二进制。GPT-3.5、GPT4和OpsGPT的回答汇总如下图所示。

GPT-3.5/GPT-4/OpsGPT进行二维码转换的结果汇总

可以看出,在超过5位数的二进制转换问题上,GPT-3.5和GPT-4的表现并不理想,而OpsGPT可以达到几乎100%的正确率。这一提升反映出OpsGPT在进一步训练后,能够实现严谨推理能力的潜力。

大语言模型正在改变这个时代,生成式AI的思维能力正日渐增长,是实现AGI(通用人工智能)的关键技术。天旦相信,目前OpsGPT所取得的成效仅仅是冰山一角。要让OpsGPT真正具备AGI的能力,在运维领域可靠地发挥作用,仍需要不断积累专业知识,并持续训练以提升人类推理能力。天旦发布OpsGPT模型,虽然只是LLM大语言模型领域的一小步,却会是运维领域的一大步,并最终实现AGIOps通用人工智能运维。经过一些完善的工作,天旦会将OpsGPT模型发布到公开平台上,与大家一起分享天旦的研究成果,也诚挚地邀请您加入我们,共同探索OpsGPT模型在运维领域的未来潜力!

关注天旦公众号

跟旦旦一起,

让运维稳定无忧,

运营做你所想。