ChrisKim
Do not go gentle into that good night.
颢天

人工智能
文章归档

基于 Swift/Megatron 完成多模态大模型分布式训练

近期由于项目需要训练大模型,学习了基于 Swift/Megatron 的大模型分布式训练技术,发现细节不少,踩了不少坑,在此记录希望能帮到大家。 本文的最重要关键词就是分布式,毕竟模型训练谁不会呢,拿 transformers 库就能训下来了,在多机平台上如何跑起高效的训练才…

   2026-04-29   1   查看全文

基于 llama.cpp 实现高性能本地大模型推理

一听到大语言模型,想必大家想到的一点就是“耗算力”“难以本地部署”。但实际上,大语言模型也有较小的版本,同时如果结合量化技术和高性能框架,在本地平台部署一个可用的大模型是完全可行的。本篇文章将会介绍使用 llama.cpp 这个高性能大模型推理框架,在本地部署开源…

   2024-12-04   0   查看全文

使用 AI 对视频进行超分与补帧

最近发现 Wallpaper Engine 上的一些动态壁纸作画很棒,但是视频质量不佳,非常可惜。于是研究了下超分与补帧相关的 AI 应用,效果令人非常惊喜,本文在此记录一下使用经验。 1 选用模型 选用 AI 应用的标准首先是开源、免费,因为市面上收费的 AI 视频增强应用…

   2024-02-16   4   查看全文