2025

四月

云端高性能模型检查点

Seung Jin Yang, Kaiyuan Eric Chen, Zhanghao Wu·2025年4月8日·阅读时长 6 分钟

三月

大规模人工智能批量推理:嵌入生成速度提升 9 倍

Kaiyuan Eric Chen·2025年3月20日·阅读时长 9 分钟

介绍 SkyPilot 客户端-服务器架构

Zhanghao Wu·2025年3月10日·阅读时长 9 分钟

滥用 SQLite 处理并发

Christopher Cooper·2025年3月4日·阅读时长 8 分钟

二月

将 DeepSeek R1 用于 RAG:注意事项

Kaiyuan Eric Chen·2025年2月26日·阅读时长 9 分钟

使用 VectorDB & OpenAI CLIP 构建大规模图像搜索:从 120 小时到 1 小时,从 $$$ 到 $

Kaiyuan Eric Chen·2025年2月11日·阅读时长 8 分钟

2024

十一月

SkyPilot 0.7:配置速度提升 3 倍、预留实例、管理功能、新硬件

SkyPilot Team·2024年11月14日·阅读时长 3 分钟

为人工智能初创公司获取 100 万美元云信用额度——并明智地使用它们

Zhanghao Wu, Romil Bhardwaj, Zongheng Yang·2024年11月1日·阅读时长 12 分钟

九月

多模态大型语言模型真的能“看”图像吗?ASCII 艺术深度探讨

Zhanghao Wu·2024年9月16日·阅读时长 6 分钟

七月

在您的基础设施上微调 Llama 3.1

Zhanghao Wu, Romil Bhardwaj, Zongheng Yang·2024年7月23日·阅读时长 5 分钟

在 Kubernetes 上轻松运行人工智能

Romil Bhardwaj·2024年7月11日·阅读时长 12 分钟

六月

SkyPilot 0.6:托管作业 API、Kubernetes 上的 SkyServe、竞价 + 按需混合、Paperspace 支持

SkyPilot Team·2024年6月4日·阅读时长 4 分钟

二月

介绍 SkyServe:在任何云上提供人工智能服务,成本降低 50%,并具有高可用性

Tian Xia, Zhanghao Wu, Ziming Mao, Zongheng Yang·2024年2月20日·阅读时长 10 分钟

2023

十二月

通过高 GPU 可用性和成本效率扩展 Mixtral LLM 服务

Zhanghao Wu·2023年12月21日·阅读时长 8 分钟

九月

云端扩展人工智能机器人

Rocky Duan (CTO, Covariant), Clay Rosenthal (生产工程师, Covariant), Marco Almeida (生产工程团队技术负责人, Covariant), Chris Colby (软件和研究负责人, Covariant)·2023年9月26日·阅读时长 10 分钟

八月

在您自己的云环境中私密地微调 Llama 2

Zhanghao Wu, Wei-Lin Chiang, Zongheng Yang·2023年8月2日·阅读时长 12 分钟

六月

使用 vLLM 和 SkyPilot 在云端将 LLM 服务速度提升 24 倍

Woosuk Kwon, Zhuohan Li, Zhanghao Wu·2023年6月29日·阅读时长 5 分钟

五月

SkyPilot 0.3:支持 LLM 并在更多云上提供前所未有的 GPU 可用性

SkyPilot Team·2023年5月30日·阅读时长 6 分钟

使用 SkyPilot 在云端分析完整小鼠脑图谱 [用户投稿]

Hanqing Liu·2023年5月1日·阅读时长 12 分钟

三月

一键在任何云上运行 LLaMA LLM 聊天机器人

Woosuk Kwon, Zongheng Yang·2023年3月20日·阅读时长 7 分钟

2022

十一月

SkyPilot:在任何云上进行机器学习和数据科学,大幅节省成本

Zongheng Yang, Ion Stoica·2022年11月16日·阅读时长 9 分钟