雨燕直播 企业级智能体推选|Token阔绰表面归零, 九科信息bit-Agent正在创造“免费数字职工”

如若说现时用户对种种智能体居品还能达成什么共鸣,那么这个共鸣好像率唯惟一个:
贵。
这里的“贵”并不一定意味着模子价钱腾贵,而是指Agent在执走运行过程中抓续产生的Token阔绰。当Agent真确参加业务历程,初始承担数据处理、运营履行、财税办事等坐褥任务时,Token资本会跟着任务界限扩大而快速累积。

任务量越大,调用次数越多;调用次数越多,Token资本越高。
关于企业和个东谈主用户而言,Agent不仅要能够完成任务,更要能够以可控的资本抓续完成任务。不然,再优秀的才气也很难撑抓大界限利用。
但小九想进一步追问:
Agent的资本,确凿只可跟着任务量增长而束缚增长吗?
一、Agent的Token为什么居高不下?
要合资Token阔绰的问题,率先需要合资现时主流Agent的运行面容。
现在,大多数Agent经受的是“感知—筹备—履行”的职责口头。每当给与到一个任务,系统都会重新感知环境、分析现时情景、理罢黜务见识、制定履行打算,并凭证履行终了抓续退换后续手脚。

主流Agent职责口头——“感知—筹备—履行”
这种架构具有很强的通用性,能够应付复杂、多变的任务场景,因此成为行业主流决策。但与此同期,它也带来了一个自然的问题:Agent会束缚重叠照旧完成过的念念考。
即便面临都备相通的任务,即便昨天刚刚履行得手过,Agent今天依然需要重新合资页面、重新分析历程、重新筹备风光,然后才能初始履行。
从终了上看,阔绰的是Token;从实质上看,阔绰的是重叠推理。
关于通达环境中的未知任务而言,这种口头是必要的,因为系统需要依靠及时推理才气应付各式变化。但企业场景通常具有显着不同的特征。大都业务历程具有踏实的规矩和重叠性。举例财税讲述、数据录入、系统巡检、运营管制等职责,履行逻辑相对固定,同类任务会被抓续重叠履行。
关于这些场景来说,企业真确需要的并不是一个每次都重新念念考的Agent,而是一个能够荟萃莳植、复用莳植的Agent。
换句话说,出于对资本的考量,咱们需要的不仅仅推理才气,更需要才气千里淀才气。
开云2026世界杯赛程分析官网bit-Agent:从“履行一次阔绰一次”到“探索一次、复用屡次”
基于这一念念考,九科信息在联想bit-Agent时,并莫得将优化要点放在简便的高下文压缩或教唆词优化上,而是从Agent的才气成长机制动手,建议了“探索+固化”的工夫蹊径。

图源:甲子光年《2026企业级智能体白皮书》
在初次战斗某项任务时,bit-Agent会参加探索阶段。
这一阶段与传统Agent近似。系统需要合资环境、分析页面结构、识别要害元素、筹备履行旅途,并在履行过程中束缚考据操作终了。大模子隆重完成推理与决策,因此会产生一定的Token阔绰。
当探索得手后,系统会将已莳植证有用的履行过程进行结构化千里淀,把操作旅途、页面特征、业务规矩以及用具调用逻辑等信息震动为可复用才气。
这一过程被称为“固化”。
固化后的才气不再依赖及时推理,而是成为系统本人的一部分。当Agent再次遭受相通或一样任务时,不错平直调用照旧千里淀完成的才气模块完成履行,而无需重新阅历完好的念念考和筹备过程。
这意味着,Agent不再是简便地完成任务,而是在完成任务的同期束缚荟萃莳植。
从资本角度来看,这种机制带来的变化尤为显着。
传统Agent的资本模子不错合资为“履行一次,阔绰一次”。任务履行次数越多,Token资本越高,两者基本呈线性增长关系。而bit-Agent的资本模子则造成了“探索一次,复用屡次”。

传统Agent的资本模子Vs.bit-Agent的资本模子
系统在探索阶段产生的资本,雨燕直播止境于学习资本;而当才气完成固化后,同类任务履行过程中对模子推理的依赖将大幅裁汰,部分场景以致不错都备绕过大模子决策要道。
这意味着,同类任务履行过程中的Token阔绰表面上不错降至零。
关于高频业务场景而言,这种互异会跟着履行次数的增多束缚放大。任务履行界限越大,才气复用带来的资本上风越显着。
从最为现实的角度启航,bit-Agent只需要付出初次探索的token资本,后续复用时阔绰的唯独低价的电费,这让企业与个东谈主用户都能够领有专属的“免费数字职工”。
从恒久运营角度来看,这不仅裁汰了模子调用资本,革新变了Agent的资本结构,使其具备了界限化部署的基础。
三、除了固化机制,bit-Agent还作念了哪些优化?
“探索+固化”是bit-Agent裁汰Token阔绰的中枢计制,但在探索阶段以及面临全新任务时,系统仍然需要调用模子完成推理。因此,九科信息还针对Agent运行过程中的多个要害要道进行了专项优化。
率先是界面信息剪辑。
在浏览器场景下,网页通常包含大都与任务无关的信息,举例告白区域、庇荫元素、重叠导航以及复杂的页面结构。如若这些内容一齐参加高下文,不仅增多Token阔绰,也会影响模子决策效果。
bit-Agent能够对页面信息进行有用剪辑,在保证页面语义完好的前提下,过滤大都无关内容,使模子聚焦于真确与任务干系的信息,从源泉裁汰高下文长度。
其次是动描摹态注入机制。
传统Agent为了保证高下文完好性,通常会抓续佩戴大都历史情景信息,导致高下文窗口束缚扩展。跟着任务链路变长,Token阔绰也会抓续增多。

高下文窗口:决定模子合资范围
bit-Agent经受按需注入计策,凭证现时任务阶段动态提供必要信息,幸免历史情景恒久占据高下文空间,在保证决策质料的同期显耀裁汰Token支出。
针对企业场景中庸碌存在的浏览器自动化需求,bit-Agent还进行了成心优化。通过对页面结构、元素识别和交互逻辑的深度处理,系统能够减少模子参与频率,让更多操作由履行层平直完成,从而进一步裁汰推理资本。
此外,在用具调用层面,bit-Agent也进行了大都优化职责。系统将常用用具和圭臬操作封装为孤立才气模块,幸免在每次调用时重叠向模子传递用具评释和操作界说。同期,用具履行终了能够平直参加履行链路,仅在要害决策节点调用模子参与判断,有用减少了用具调用过程中的Token放大效应。

bit-Agent“才气与用具调用”模块
这些优化要领共同作用,使bit-Agent即使面临全新任务,也能够以更低的资本完成探索过程;而跟着才气束缚千里淀和固化,系统举座运行资本还将抓续下落。
结语
跟着Agent的才气界限安靖扩大,测度其价值的圭臬正在发生变化。用户初始眷注系统能否在恒久运行过程中保抓踏实、可靠和可控的资本结构。
从这个角度来看,裁汰Token阔绰的要害并不仅仅减少模子调用次数,而是减少无谓要的重叠推理。
当行业还在征询奈何让Agent领有更强推理才气的时间,bit-Agent正在科罚另一个愈加现实的问题:奈何让Agent在实在办公环境中抓续学习、抓续荟萃,并以更低的资本创造恒久价值。
如若你也想领有低资本的智能自动化办公体验雨燕直播,欢招待洽小九,让咱们联袂共进,共创数智改日!