ChrisKim
Do not go gentle into that good night.
颢天

由 ChrisKim 发布
作者归档

基于 Nginx 实现大模型接口负载均衡与故障转移

近期我在多台服务器上通过 vLLM 部署了大语言模型提供 API 服务,以此进行大批量模型推理数据生成任务。在多节点的大模型推理中,负载均衡和故障转移对于效率和稳定性是至关重要的。在经过研究后,我觉得使用 Nginx 来完成这个任务是最简单和成熟的,本篇文章将会介绍…

   2025-10-28   0   查看全文

基于 vLLM 在昇腾 910B 平台完成大模型分布式推理

最近由于项目原因,拿到了 95 万元的华为云代金券。项目需要进行大规模的大模型推理生成任务,为了利用好华为云的资源,于是我研究了下如何在华为云的昇腾 910B 平台部署大模型。尽管没有成熟的 CUDA 平台方便,但实际上整个流程也没有太过于困难,本篇文章便简单分享…

   2025-10-18   3   查看全文

OpenWrt 绕过校园网多设备路由器检测

前几天重庆大学研究生开学了,搬进宿舍把所有设备折腾好后,我的校园网账号就突然被踢下线了,显示账号不可使用路由器进行多设备共享,这给我搞得猝不及防。由于我有一台小主机在寝室做服务器,刚需内网环境,因此绕过这个多设备检测就是不得不做的了,本文便介绍一下…

   2025-09-13   2   查看全文

直流电源优雅解决方案

在我桌面上有许多直流设备,例如台灯、显示屏、USB 拓展坞等等,每个设备都附带了配套的直流电源适配器。当设备数量比较少的时候问题还不大,但随着我的设备数量增多,我发现使用这一堆直流电源是一个相当噩梦的事情。 一堆形状各异的砖头电源 首先就是插线板实…

   2025-07-18   2   查看全文

毕业总结

这一天如期而至,我的大学时光也在 6 月 17 日正式画上了句号。毕业也不是什么突然发生的事情,但清理物品、离开学校、回到家中,还是有种莫名的突兀感:从现在开始,大学生活就是我的过去了啊。 思来想去,还是觉得有必要用一篇文章来总结一下这四年。首先我想回首…

   2025-07-11   14   查看全文

中国邮政信件寄送指南

在临近大学毕业时,我一直在想给同学和老师送一些什么东西留恋比较好。偶然,在 b 站看到了关于邮政寄信的视频,顿时让我有了灵感:不如就用最原始的方法,用邮政寄明信片吧! 说干就干,于是这个计划从 6 月初正式启动,准备了各种物资到 9 号进行第一次试水,然后…

   2025-07-04   2   查看全文

大语言模型如何思维?瓶颈何在?

从 2022 年 ChatGPT 推出第一个商用大语言模型,到阿里 Qwen 不断迭代开源模型,再到近期 DeepSeek 的爆火,大语言模型几乎已经家喻户晓,它很可能是普通人用过的第一个人工智能产品。但由于绝大多数人根本不了解其底层原理,以至于被大语言模型的表现震撼后,直接将其…

   2025-04-25   4   查看全文

Prometheus + Grafana 监控快速上手

本站的监控系统从 Uptime Robot 换到 Uptime Kuma 再到 Nezha,总觉得它们太过于儿戏,很多功能不够严谨,甚至有些功能隐含安全风险。为了一次到位,我决定将服务器的监控系统换成 Prometheus + Grafana. Prometheus 是一个开源的、工业级的监控框架,通过通用或者…

   2025-02-23   10   查看全文
状态
2025-02-14

今天是颢天博客建站五周年!

感谢所有小伙伴的支持!新的一年我也要继续进步,继续带来高质量的文章。

另外,前不久本站也申请加入了十年之约,本站也要争取活到十五周年呢。

使用 MacType 优化 Windows OLED 子像素渲染

最近闲鱼捡了台华为 Matebook E 2023,这台平板电脑用的是 2560*1600 120Hz 的 OLED 屏幕。我之前从来没有在 Windows 上使用过 OLED 屏幕,本以为它会给我无与伦比的显示体验,但结果却是一开机就让我感觉哪里不对。我发现字体边缘明显有彩边,同时一些明暗切换的像素…

   2025-02-09   2   查看全文
加载更多