跳转至主要内容

Ctrl+K

v0.3.3
- latest
- v0.5.2
- v0.5.1
- v0.5.0
- v0.4.1
- v0.4.0
- v0.3.3
- v0.3.2
- v0.3.1

教程

安装指南
开发者指南
Workflow 开发指南
Algorithm 开发指南
Algorithm 进阶开发
Operator 开发指南
🧪 实验性功能：任务选择与调度系统
参数配置指南
Synchronizer 介绍

样例

快速上手
Off-Policy RFT
异步 RFT
多轮对话拼接任务
通用多轮 RFT
ReAct Agent 训练
邮件搜索例子
离线 DPO 和 SFT
Megatron-LM 支持
数据处理

常见问题

常见问题

API Reference

API Reference

.rst

trinity.common.models.model module

trinity.common.models.model module#

上一页

trinity.common.models.mm_utils module

下一页

trinity.common.models.utils module

作者： Trinity-RFT Team

© Copyright 2025, Trinity-RFT Team.