MNN Chat app是一款基于阿里巴巴MNN引擎打造的全功能多模态端侧AI应用,其定位与Google AI Edge Gallery类似。该应用最大的亮点在于,它能让复杂的AI大模型完全脱离网络运行,借助当前高性能安卓手机的CPU/GPU算力,将AI聊天、AI生成图文、AI视频制作、AI写代码等常见功能全部在手机本地完成,无需依赖任何AI厂商的服务器,从而更好地保护用户的数据隐私,并提供高度可定制的AI服务。

作为安卓手机里的“全能AI百宝箱”,MNN Chat app集成了多种功能的“全能助手”。用户不仅能与它流畅对话,还能让它直接识别照片内容、理解语音指令,甚至根据要求现场画图、制作视频或生成网站。此外,MNN Chat app深度适配手机硬件,运行速度极快,并支持目前市面上大多数流行的AI模型。可以说,MNN Chat app将AI装进了你的口袋,既是不费流量、保护隐私的私人助理,也是体验前沿AI技术的首选神器。
【多模态支持】
提供多种任务功能,包括文本生成文本、图像生成文本、音频转文本及文本生成图像(基于扩散模型)。
【CPU推理优化】
在安卓平台上,MNN-LLM展现了卓越的CPU性能,预填充速度相较于llama.cpp提高了8.6倍,相较于fastllm提升了20.5倍,解码速度分别快了2.3倍和8.9倍。下图为 llama.cpp 与 MNN-LLM 的比较。
【广泛的模型兼容性】
支持多种领先的模型提供商,包括Qwen、Gemma、Llama(涵盖TinyLlama与MobileLLM)、Baichuan、Yi、DeepSeek、InternLM、Phi、ReaderLM和Smolm。
【本地运行】
完全在设备本地运行,确保数据隐私,无需将信息上传至外部服务器。
本站免费下载安装应用后,您可以在模型市场界面中浏览所有支持的模型
然后选择你需要的ai大模型下载
下载好后就可以直接在应用内与模型交互
此外,您可以通过侧边栏访问聊天历史,轻松查看和管理之前的对话记录
全能创作官:
它不只是陪你聊天,更是你的全职文案加程序员。无论是写复杂的学术论文、策划活动方案,还是直接在手机上帮你写出一段能运行的代码,它都能手到擒来。
随身多媒体工作室:
它是你的全能绘图师与视频帮手。你可以一句话让它生成精美的画作,或者让它看懂一段视频并帮你总结核心内容、提取文案,甚至辅助你完成视频剪辑思路,实现从文字到图文、再到视频的跨维度创作。
真正的“智慧大脑”:
相比其他单一功能的 App,它更像是一个超级枢纽。它能同时理解图片、声音和视频,你可以拍一张复杂的流程图让它转化成代码,或者录一段会议音频让它直接生成带配图的PPT大纲。
不插线的“工作站”:
最关键的是,这些高强度的创作任务(画图、分析视频、写程序)全是在你手机本地完成的。这意味着你拥有了一个不费流量、不收月费、响应极快的高性能 AI 工作站,随时随地开启生产力。
v0.8.2.2版本
更新亮点:
刷新内置 MNN runtime,带入最新的 CPU LinearAttention 与 Arm82 fp16 优化路径。
提升思考模式提示词和数组拼接场景下的 tokenizer 与模板渲染兼容性。
为 OpenCL 和 Metal 执行路径补充 TopKV2 后端支持。
问题修复:
修复 Android 点击 Add Local Model 时的崩溃问题。
避免模型加载时因 mmap 权重部分初始化而导致的死锁问题。
对同模型启动 API 服务时复用已加载 runtime session,避免额外重载导致的卡死或崩溃。