跳转至主要内容

Ctrl+K

v0.5.1
- latest
- v0.5.2
- v0.5.1
- v0.5.0
- v0.4.1
- v0.4.0
- v0.3.3
- v0.3.2
- v0.3.1

教程

安装指南
开发者指南
Workflow 开发指南
Algorithm 开发指南
Algorithm 进阶开发
Operator 开发指南
🧪 实验性功能：任务选择器
参数配置指南
GPU 资源相关配置指南
Synchronizer 介绍
与 veRL 对齐训练配置
监控指标解释

样例

快速上手
Off-Policy RFT
异步 RFT
多轮对话拼接任务
通用多轮 RFT
ReAct Agent 训练
邮件搜索例子
离线 DPO 和 SFT
Tinker 后端
Megatron-LM 支持
数据处理
样例总览

常见问题

常见问题（FAQ）

API Reference

API Reference

.rst

trinity.common.models.mm_utils module

trinity.common.models.mm_utils module#

上一页

trinity.common.models.vllm_patch.worker_patch module

下一页

trinity.common.models.model module

作者： Trinity-RFT Team

© Copyright 2025, Trinity-RFT Team.