Transformers.js v3.1 版本发布：纯浏览器 AI 模型运行新体验-百合树AI写作-专业学术论文写作助手

收录于话题

??大家好！欢迎来到创意Ai实验室公众号。感谢大家的支持与鼓励。在AIGC探索道路上，我将与你一路同行。喜欢就星标关注创意Ai实验室公众号文末扫码加入交流群或前往我的个人网站.

Transformers.js v3.1 版本发布：纯浏览器 AI 模型运行新体验

Transformers.js 发布了 v3.1 版本，这是一个重要的更新，因为它现在支持在纯浏览器环境中运行多种模型。这些模型包括 any-to-any、text-to-image、image-to-text 和姿势检测等。特别值得一提的是，新版本还增加了对 DeepSeek Janus 和 Qwen2-VL 的支持。官方还为 DeepSeek Janus 推出了一个在线演示，让用户可以亲自体验纯浏览器运行的效果。

新版本的主要特点

1. 纯浏览器环境支持

Transformers.js v3.1 版本的一个显著特点是它能够在纯浏览器环境中运行 AI 模型。这意味着用户无需安装任何额外的软件或依赖，就可以直接在浏览器中使用 AI 功能。这种能力的实现，得益于 WebGPU 技术的支持，它允许在浏览器中直接使用 GPU 进行高性能计算。

2. 多种模型支持

新版本支持多种 AI 模型，包括 any-to-any、text-to-image、image-to-text 和姿势检测等。这些模型的集成，使得 Transformers.js 成为一个多功能的 AI 工具库，能够满足不同用户的需求。

3. DeepSeek Janus 和 Qwen2-VL 支持

DeepSeek Janus 和 Qwen2-VL 是两个强大的 AI 模型，它们的加入极大地扩展了 Transformers.js 的功能。DeepSeek Janus 是一个基于自回归的多模态理解与生成统一模型，它通过解耦视觉编码，提升了模型的灵活性，并有效缓解了使用单一视觉编码导致的冲突和性能瓶颈。Qwen2-VL 同样是一个多模态模型，它支持文本到图像的生成。

4. 在线演示

官方为 DeepSeek Janus 推出了一个在线演示，这使得用户可以无需任何设置，直接在浏览器中体验 AI 模型的运行效果。这种演示不仅方便了用户体验，也为开发者提供了一个展示模型能力的平台。

使用案例

1. 文本到图像的生成

用户可以使用 Transformers.js v3.1 版本中的 text-to-image 模型，将文本描述转换成图像。例如，用户可以输入一段描述，如“一个穿着红色衣服的公主站在城堡前”，模型将根据这段描述生成相应的图像。

2. 图像到文本的转换

image-to-text 模型允许用户上传一张图片，模型将分析图片内容并生成描述图片的文本。这对于视觉障碍人士或者需要自动图像标注的应用非常有用。

3. 姿势检测

姿势检测模型可以分析图像中的人物姿势，并识别出不同的动作。这对于健身应用、游戏或者安全监控等领域都有广泛的应用。

性能和效率

Transformers.js v3.1 版本的另一个重要特点是它的性能和效率。由于 WebGPU 的支持，模型可以在浏览器中直接使用 GPU 进行计算，这大大提高了运行速度和处理能力。用户可以在几秒钟内得到模型的输出结果，这对于需要快速响应的应用场景非常重要。

结论

Transformers.js v3.1 版本的发布，标志着 AI 模型在浏览器中的应用进入了一个新的阶段。它的多功能性、易用性和高性能，使得开发者和用户都可以在浏览器中轻松地使用 AI 功能。随着技术的不断进步，我们可以期待 Transformers.js 在未来的版本中带来更多的创新和惊喜。

在线使用地址：https://huggingface.co/spaces/webml-community/Janus-1.3B-WebGPU

项目地址：https://github.com/huggingface/transformers.js/releases/tag/3.1.0

??我的网站：查看更多AI工具可以前往我的个人网站：https://szqs.site/（在浏览器打开）与其他的艺术家和创作者一起交流心得，分享经验，共同进步。

??我的社群：和创作者一起交流心得，分享经验，共同进步。

Transformers.js v3.1 版本发布：纯浏览器 AI 模型运行新体验