大型语言模型

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论
  • 边缘侧的电信大模型
    IEEE通信学会发布《电信领域大规模AI应用——创新、规模化落地与数字体验升级路线图》白皮书,指出电信大模型与边缘计算的融合是计算与网络技术领域的范式变革。通过将大语言模型与边缘计算结合,可以解决资源受限问题,提高实时处理能力和隐私安全性。大语言模型的优化技术和云边协同架构有助于实现高性能与资源节约的平衡。在自动驾驶、医疗健康、工业物联网等领域,这种融合技术展现出巨大潜力。未来,微型机器学习和联邦多任务学习等技术也将推动边缘增强型微型机器学习的发展。
  • AI对物联网的两面性:除了正向赋能,也可能形成"技术债务"
    大语言模型为代表的AI新技术在物联网系统研发和实施中的应用,给物联网系统带来前所未有的效率提升,将AIoT推进到新的阶段。不过,AI和物联网的融合,带来正向赋能的同时,也存在一些潜在的风险。近日,一位长期从事工业物联网的专家撰文指出,人工智能工具加速物联网开发,但在接近硬件的层面,一些看似正确的代码可以悄无声息地同时破坏数千台设备,人工智能可能会给物联网形成大量“技术债务”,需高度重视这一现象并提前采取措施。
    227
    05/12 09:50
    AI对物联网的两面性:除了正向赋能,也可能形成"技术债务"
  • 10美元板子,45MB内存,跑10亿参数大模型——PicoLM把LLM推理拉到嵌入式极限
    PicoLM项目展示了如何在一个仅10美元的板子上使用256MB内存运行一个10亿参数的大模型。通过巧妙的内存管理和优化,实现了高效的推理性能,并且强调了小型化和离线使用的可能性。
  • LLM推理的硬件危机,比你想的严重得多
    Google DeepMind的两位工程师发布了一篇关于大模型推理硬件的论文,指出当前硬件架构不适合推理任务,尤其是在解码阶段。论文提出四种解决方案:高带宽闪存(HBF)、近存计算(PNM)、3D内存逻辑堆叠和低延迟互连。这些方案旨在解决内存带宽、容量和通信延迟等问题,而非单纯增加算力。研究者呼吁学术界和产业界合作,共同推动推理硬件的发展。
    LLM推理的硬件危机,比你想的严重得多
  • 电信行业大模型产业洞察:当前趋势、市场驱动因素与壁垒
    IEEE通信学会(ComSoc)发布的《电信领域大规模AI应用——创新、规模化落地与数字体验升级路线图》(LARGE-SCALE AI IN TELECOM——Charting the Roadmap for Innovation, Scalability, and Enhanced Digital Experiences)白皮书,为行业指明了一条融合生成式AI与电信大模型(LTMs)的革命性路径。
    电信行业大模型产业洞察:当前趋势、市场驱动因素与壁垒
  • KULAAI上线:聚合多家语言模型,提供统一AI工具入口
    随着大模型应用场景不断扩展,AI工具也变得越来越多。对不少用户来说,问题已经不只是“有没有AI工具”,而是“该用哪个、怎么切换、怎么更高效地用”。在这样的背景下,聚合式AI工具平台开始受到更多关注。 KULAAI(k.kulaai.cn)近日上线,主打聚合多家语言模型,尝试把分散的AI能力整合到一个平台中,为用户提供更统一的调用入口和使用体验。对于需要频繁使用AI的人来说,这类平台的价值,往往不只
  • ChatGPT怎么开始使用?从零开始教程:结合2026年AI热点趋势
    在2026年的今天,人工智能已经深度融入我们的工作和生活。从AI治理全球化到多模态实用化,从智能算力规模化到原生AI终端硬件普及,AI技术正以前所未有的速度演进。对于许多希望跟上时代步伐的朋友来说,掌握像ChatGPT这样的主流AI工具已成为一项必备技能。本文将为您提供一份详尽的从零开始教程,并结合当前AI热点,帮助您高效开启AI之旅。如果您正在寻找一个便捷的AI工具聚合平台来探索更多可能性,h.
  • Gemini精准提问工程实践:从模糊需求到高质量输出
    h.kulaai.cn作为AI工具聚合平台,提供了模型对比测试、成本监控、多模态调试等实用功能,帮助开发者验证和优化提问策略。建议开发者在实际项目中建立提问质量评估机制,持续迭代优化。
  • AI API中转安全隐患:恶意中转注入代码、窃取密钥、盗走 ETH 实测
    研究人员调查发现,许多付费和免费的AI中转服务存在安全隐患,包括恶意代码注入、密钥泄露等问题,导致用户数据可能被窃取并用于非法用途。尽管多个主流AI代理框架均未能有效防护此类攻击,已有部分防御措施提出,但其实际效果和普及程度仍有待提高。
    5153
    04/13 10:57
  • 腾讯面试官:“Agent不就是LLM加点工具?”我:“ReAct、MCP、Skills、A2A …”
    本文介绍了Agent及其相关概念,包括LLM、Agent、Workflow、Function Call、MCP、Skills和A2A协议。主要内容如下:LLM:大语言模型,能够生成文本,但不具备执行操作、记忆历史、使用工具和规划任务的能力。Agent:在LLM的基础上增加了工具、记忆和规划能力,能够自主完成任务。常见的工作模式包括ReAct、Plan-and-Execute、Reflection和Multi-Agent。
  • 智能驾驶真的需要语言模型吗?
    语音控制系统在汽车中的应用引发了关于软件定义汽车时代安全性的讨论。尽管语音助手能够提高便利性,但也存在误解指令的风险,尤其是在高速行驶环境下。语音助手依赖于语音识别和自然语言理解,但在极端情况下可能会做出不当回应。因此,为了确保安全,需要在系统架构上采取措施,例如硬件冗余和语义校验机制,以防止潜在的安全隐患。最终,语音助手应当作为助手而非主宰,确保在危急时刻提供可靠的响应。
    智能驾驶真的需要语言模型吗?
  • 之江实验室薛贵荣:当AI开始做科研,我看到了大语言模型的天花板
    2023年12月12日,第八届GAIR全球人工智能与机器人大会在深圳举行。之江实验室科学模型总体组技术总师薛贵荣博士介绍了科学基础模型的概念及其在科学领域的应用前景。
    之江实验室薛贵荣:当AI开始做科研,我看到了大语言模型的天花板
  • 基于大语言模型的AI智能设备管理实践
    在当今工业领域,设备管理正经历一场深刻的智能化变革。如何利用大语言模型等AI技术,从硬件驱动、软件重构、数据激活三大方向对传统体系进行颠覆性升级?如何实现由数据和智能驱动的精准、高效、无人化的新一代管理模式?
    基于大语言模型的AI智能设备管理实践
  • 选择一套“会思考”的架构:LLM 智能体推理与工作范式解析
    《国务院关于深入实施“人工智能+”行动的意见》指出,到2027年,人工智能将在六大领域广泛融合,智能体应用普及率超过70%,标志着重大国家战略与行业变革机遇的到来。本文探讨了智能体推理方法的三大类别:单智能体方法、基于工具的方法和多智能体方法。
    选择一套“会思考”的架构:LLM 智能体推理与工作范式解析
  • BitNet模型架构能否打破LLM存储瓶颈?
    微软开源的BitNet模型采用三元量化技术,实现了极致的效率和成本效益,降低了内存占用和能耗,提升了推理速度。BitNet已在Arm和x86平台上展示出显著性能提升和能效优势,适用于各类智能硬件。芯动力已成功适配BitNet模型,推动国产AI加速技术进步。BitNet有望在手机、汽车和家电等领域引发变革,助力边缘AI的普及。
    BitNet模型架构能否打破LLM存储瓶颈?
  • Cognizant加速AI模型企业级开发
    新泽西州蒂内克2025年7月31日 /美通社/ -- Cognizant(纳斯达克股票代码:CTSH)今日宣布推出AI Training Data Services,该全新解决方案旨在帮助企业快速且大规模地构建、微调和实施AI模型。 Cognizant 凭借其作为数据与AI模型训练合作伙伴的深厚经验,继服务于部分领先的数字原生企业后,现正将这一专长应用于全球2000强客户,推动AI创新。 Cogn
  • 深度丨谷歌推出全新底层架构MoR,Transformer有了替代品
    大语言模型(LLMs)规模庞大但效率低下的问题长期备受关注。尽管模型参数持续增长,其在长文本处理中的性能衰减、计算资源消耗等问题始终未能有效解决。谷歌DeepMind最新提出的MoR架构,可能为这一困境提供了新的解决路径。
    深度丨谷歌推出全新底层架构MoR,Transformer有了替代品
  • 特斯拉Grok + FSD=VLA?
    最近,由 xAI 开发的 LLM大语言模型 Grok 已被整合进特斯拉。终于改写了特斯拉汽车无智能语音对话的短板,不过目前,在北美只有部分类似于KOL的人士使用。现在,很难预测特斯拉何时会将 Grok 正式发布上车,时间可能在几个月到几年之间。
    2225
    2025/07/21
    特斯拉Grok + FSD=VLA?
  • 2025爱分析·领域大模型市场厂商评估:明略科技
    01、公司介绍 明略科技成立于2006年,是中国企业级数据智能应用领域的主要服务商之一。经过19年发展,公司已构建覆盖大模型技术、行业知识库与多模态数据处理的企业级解决方案体系。根据公开资料显示,其客户群体包括两类:一是超过2000家大型企业客户,其中涵盖135家《财富》世界500强企业(截至2024年6月);二是采用标准化SaaS产品的中小企业客户,规模超20万家。行业覆盖方面,该公司重点服务零
    2025爱分析·领域大模型市场厂商评估:明略科技
  • 广和通推出软硬件一体化的全栈式AI解决方案MagiCore灵核,重塑AI交互体验
    5月,广和通发布全新软硬件一体化的全栈式AI解决方案MagiCore灵核,以"硬件设计+无线通信+AI音频算法+云端大模型+全球AI云服务"深度融合,重新定义AI对话交互开发范式。该方案实现从通信模组到AI应用层的全链路垂直优化,为AI玩具、AI音箱等消费电子、智慧家居场景提供"即插即用"的AI升级方案。 在硬件层面上,基于广和通深厚的通信和硬件设计能力,MagiCore在通信、尺寸、功耗、供电方

正在努力加载...