跳转至主要内容

Ctrl+K

v0.3.1
- latest
- v0.5.2
- v0.5.1
- v0.5.0
- v0.4.1
- v0.4.0
- v0.3.3
- v0.3.2
- v0.3.1

教程

安装指南
开发者指南
Workflow 开发指南
Algorithm 开发指南
Algorithm 进阶开发
Operator 开发指南
参数配置指南
Synchronizer 介绍

样例

快速上手
Off-Policy RFT
异步 RFT
多轮对话拼接任务
通用多轮 RFT
ReAct Agent 训练
邮件搜索例子
离线 DPO 和 SFT
Megatron-LM 支持
数据处理

常见问题

常见问题

API Reference

API Reference

.rst

trinity.common package

目录

Subpackages
Submodules
Module contents

trinity.common package#

Subpackages#

trinity.common.models package
- Submodules
- Module contents
trinity.common.rewards package
- Submodules
- Module contents
  - RewardFn
    - RewardFn.__init__()
trinity.common.workflows package

Submodules#

trinity.common.config module
trinity.common.constants module
trinity.common.experience module
trinity.common.verl_config module

Module contents#

上一页

trinity.manager.synchronizer module

下一页

trinity.common.models package

目录

Subpackages
Submodules
Module contents

作者： Trinity-RFT Team

© Copyright 2025, Trinity-RFT Team.