阅读提示
地球上有一种最古老、最具生命力和延续性的生物体,叫阿米巴,可以向各个方向伸出“伪足”,从而使整个身体的形状变化不定,造就了强大的适应能力,在地球上已经存在了几十亿年。
1959年,稻盛和夫成立京瓷公司,历经4次全球性的经济危机仍屹立不倒,专家学者研究后发现,京瓷的经营方式与“阿米巴虫”的群体行为方式非常类似,于是得名“阿米巴经营模式”。在该模式下,企业组织可以随外部环境变化而不断“变形”,调整到最佳状态,即能适应市场变化的灵活组织。其思路是把公司分成若干个独立核算的小组,采取最简单的会计核算方法,通过交易获取利润,自食其力、自负盈亏。
而拥有几万座加油站的石油化工企业,如何发挥“阿米巴经营模式”的优势?本文深入分析了AI(人工智能)大模型技术在加油站零售行业的应用前景及构建AI大模型的原则和路径,旨在帮助油品零售行业的各级管理人员提升能力并提高零售终端的竞争力。敬请关注。
所有的行业都可以凭借技术创新、模式创新、价值创新而蜕变。
在当今数字化的世界中,人工智能(AI)和大数据技术的发展影响到生活的各个方面。这一领域的最新技术之一——大模型技术,正对众多行业产生深远影响。
大模型技术对于成品油零售行业的高质量发展与转型升级同样具有重要的现实意义和独特商业价值,特别是对于新能源业务发展与出行生态建设,更是不可替代的专业能力提升与业务创新的助推器。
加油站行业是一个与国民经济和人民生活息息相关的行业,也是一个竞争激烈且高度同质化的行业。在大力推广“阿米巴自主经营模式”的趋势下,加油站经理和各级管理人员须不断提高市场化竞争的能力以应对激烈竞争。打造专业化的AI大模型技术应用,就成为合规守正、集智创新、快速智能、自我进化的智慧解决方案有效抓手。
本版文字由 王旭东博士 陈欢博士 唐傲博士 杨绪勇博士 提供
AI技术从来没有像现在这样成为人们广泛讨论的技术,人工智能正在改变和影响人们生产生活的方方面面。概括地说,大模型技术是指超大规模神经网络模型通过海量数据和计算资源不断训练和优化,从而实现更加精准和高效的人工智能模型,利用其良好的泛化能力和涌现能力实现多场景应用的技术。它不是从无到有的技术,而是随着深度学习技术取得突破而来,其应用场景已经在语言教育、医学诊断、图像生成、证券金融、文娱生活、生命科学等诸多领域得到迅猛发展。
大模型技术应用场景可归为两大类,其一是作为人机交互接口的“大模型+应用”,例如今天的许多“在线客服”将被其替代;其二是作为决策辅助的“人工大脑”,充分发挥其在大数据处理、逻辑推理、分析判断的能力并构建专属场景应用,成为更博学、更智慧、更高效、更理智的行业专家。随着大模型技术的成熟与广泛应用,特别是在各行各业的垂直应用,必将触发一次新的产业革命,从而提升人类社会的生产效率。
大模型是在超大规模数据集上进行预训练、对人类知识和经验进行学习和提炼,形成的自主学习、自行推理的具备生成能力的算法模型。
大模型涉及的关键技术众多,其中模型架构、训练数据集、算力及训练算法等尤为关键,大模型的建立与应用,需要专业的人才搭建模型架构,也需要海量的数据资源用于对大模型训练,还需要足够的算力支撑,更需要对训练算法持续优化。
目前应用最广泛的Transformer(转换器)模型架构,采用自注意力机制,能够有效捕捉序列中的局部和全局信息,从而提高模型的涌现能力和泛化能力。涌现能力是指模型具有从原始训练数据中自动学习并发现新的、更高层次的特征和模式的能力。这些独立模态或跨模态新特征、能力或模式通常不是通过目的明确的编程或训练获得的,而是模型在大量多模态数据中自然而然学习得到,涌现能力是人工智能领域所获得的全新能力。涌现能力使大模型能够在无须人工干预的情况下,从原始的多模态数据中自动学习复杂的特征和模式,从而实现更准确和更高效的预测和决策。大模型技术这一特征特别适用于为点多面广的超大加油站网络的站经理提供经营决策支持,可以成为名副其实的AI决策助手。
为提升大模型应用的可靠性,需要大规模的数据集进行训练,其中自监督学习是一种常用的方式。自监督学习通过利用数据自身的特征进行标注,充分利用大规模的无标注数据集,大幅增强模型的训练效果。
大模型具有数据量大、数据带宽要求高、算力要求高的计算特点,且算法相对单一。如果要提高计算效率和性价比,就应该像超算那样选择更高计算密度的算力芯片。
此外,大模型的训练需要采用一些优化算法,如Adam(自适应矩估计算法)、LAMB(最小均方算法)等,以加速模型的收敛和提升模型的泛化能力。一个大模型的训练涉及众多问题,这些问题不仅有算法的设计问题、数据的准备问题,而且是一个精细化的工程问题,面临的挑战包括内存、通信、计算和调优等。
大规模预训练形成行业自主模型
大模型技术应用具有优良的精准性和泛化能力,为各种任务和应用场景带来更好的解决方案。大模型使用更多的参数和更复杂的结构,从而能够更好地表达数据中的复杂特征和规律,提高模型对数据的理解和刻画能力,提高模型的泛化能力和鲁棒性(Robust,强壮性、健壮性,指在异常和危险情况下系统生存的能力),为人工智能的应用带来了更广阔的前景和更多的可能性。
目前各行业需求和业务场景众多,人工智能需求呈现出碎片化、多样化的特点。从开发、调参、优化、迭代到应用,模型研发成本极高,且难以满足市场定制化需求,大模型提供了一种可行方案,也就是“预训练大模型+下游任务微调”的方式。大规模预训练可以有效地从海量标记和未标记的数据中获取知识,通过将知识存储到海量的参数中,并对特定任务进行微调,极大地扩展了模型的泛化能力,特别是对于垂直行业的应用,可以在预训练大模型的基础上固定模型参数,再采用高质量的行业小样本标注数据对模型任务进行微调,形成精准的行业人工智能模型,并进行快速应用和迭代,从而形成行业自主的模型。大模型采用的自监督学习方法及人类反馈的强化学习RLHF(人类反馈强化学习)等技术,可以减少数据标注,这在一定程度上解决了人工标注成本高、周期长、准确度不高的问题。行业人员不必花费更多精力在基础模型的建立和训练上,可将注意力集中在行业数据的标注和处理上,有效降低研发成本和技术实施的门槛。
随着大模型的参数规模、数据量、算力和训练技术的提高,大模型的精度也在不断提高。各个行业多样的业务场景应用和自主模型也必将受益于其良好的泛化和迁移学习性能,不断通过行业小样本数据训练和迭代来提升自主模型的精准性和鲁棒性。此外,通过提示词(prompt)及思维链(chain of thought) 等相关技术,能够挖掘模型的分析和推理能力,在细分任务上取得更优表现。