扫码加入

Token

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

Tokens是大语言模型(LLM)用来切割自然语言文本的基本单位,反映模型推理过程的计算量。

Tokens是大语言模型(LLM)用来切割自然语言文本的基本单位,反映模型推理过程的计算量。收起

查看更多
  • 2026,决战AI:Token就是AI,AI就是Token!
    Token作为AI推理服务的计费单位,代表了公有云化、大规模部署且价格极低的AI推理能力。本文介绍了Token的概念及其在AI推理服务中的应用,并邀请对AI-Token创业感兴趣的读者加入交流群。
    2655
    01/20 11:19
    2026,决战AI:Token就是AI,AI就是Token!
  • Token不是一切:AI云的竞争才刚刚开始
    云计算市场持续火热,特别是MaaS和AI大模型领域的快速增长。然而,仅凭Token调用量无法全面反映市场真实状况,企业级市场的需求更为复杂,涉及数据治理、流程改造和组织适应。未来竞争将回归全栈能力,谁能整合模型与基础设施,提供最高性价比,谁将占据优势。
    608
    01/08 10:31
    Token不是一切:AI云的竞争才刚刚开始
  • AI-Token的核心竞争力
    AI-Token市场迅速增长,预计至2030年达到3万亿规模。AI-Token的核心竞争力在于价格,而非客户关系。为了应对价格竞争,AI工厂应优化成本,特别是通过软硬件协同优化和芯片架构优化来提高性能和降低成本。具体措施包括使用MLA技术提升内存效率,采用多Token预测技术加快推理速度,以及通过专用处理器卸载计算任务。此外,随着大模型的成熟,加速计算可以从GPU转向更高效的X-AIPU,进一步降低成本。
    1791
    2025/12/31
    AI-Token的核心竞争力
  • 第一批大模型公司要上市了,问题是如何给智谱、Minimax们估值?
    智谱AI和MiniMax相继通过港交所聆讯,标志着中国大模型行业进入资本考验阶段。尽管两家企业展现出高增长和高投入的特点,但面临高亏损的局面。为了适应AI时代的估值需求,文章提出将Tokens作为核心计价单位,通过 ARR 和相对估值法等方法,尝试评估大模型公司的价值。
    716
    2025/12/24
    第一批大模型公司要上市了,问题是如何给智谱、Minimax们估值?
  • Tokens经济,站上“火山口”
    火山引擎通过 Tokens 调用量评估大模型的真实价值,推动 AI 技术与产业需求紧密结合。在 AI 云原生架构下, Tokens 成为衡量智能规模的标准,促进了模型、客户与商业化的无缝对接。火山引擎通过提供灵活的 AI 能力组合和服务,广泛应用于汽车、智能终端、金融等多个行业,帮助企业降低成本并提高效率。
    Tokens经济,站上“火山口”
  • 从智算中心转型AI工厂:Token模式的六大优势
    算力界一直在努力的推进算力标准计量的工作,希望能够像电力的度数(千瓦时)一样,但进展并不是很顺利,原因就在于算力很难标准化,大家对算力标准化工作的认可度也很低。而Token模式,换了一种方式,更有效地实现了算力的标准计量。
    从智算中心转型AI工厂:Token模式的六大优势
  • All in Token:“AI工厂”业务模式分析
    AI大模型Token服务,也被形象的称为AI工厂,从去年开始兴起,今年下半年逐渐爆发。最近非常多的朋友询问AI Token相关的技术和业务的情况,希望能开展Token相关的业务。通过这篇文章,简单跟大家介绍一下“AI工厂”的业务模式。
    All in Token:“AI工厂”业务模式分析
  • 云市场差异化角逐,字节、百度、华为如何出新?
    根据Omdia的报告,2025年上半年,中国AI云市场规模达223亿元,其中阿里巴巴占比达到35.8%,市场份额“断层第一”。在单一客户多云供应的背景下,价格战已然打响,选择token服务这一新兴市场打造常态化营收,还是投身政企平台获取大额订单加持,路线的选择或将决定企业的市场站位。面对阿里在市场规模上的绝对优势,字节、百度、华为等企业又将如何出新?
    云市场差异化角逐,字节、百度、华为如何出新?
  • 如何正确理解Token经济学?
    去年5月,大模型厂商卷起价格战,以Tokens为主要定价单位。Tokens是大语言模型(LLM)用来切割自然语言文本的基本单位,反映模型推理过程的计算量。模型厂商营收与其tokens调用量呈现显著同步的高增趋势。OpenAI、Anthropic、字节跳动等基模厂商主要有C端和B端两种模式。C端主要包括大流量池产品的附加AI功能、原生聊天助手和视频赛道的新兴应用。B端主要是企业级AI应用。技术迭代解锁应用需求,使AI应用更加实用、准确和高效。随着技术的进步,大量原本因“不准、不全、不落地”而被搁置的需求将被解锁。
    如何正确理解Token经济学?

正在努力加载...