Releases: DeepLink-org/ditorch
Releases · DeepLink-org/ditorch
v0.1.1 releasenote
版本号
v0.1.1
版本更新
- 添加算子数据类型转换能力 #19
- 支持torch_br #20
- 重构算子工具 #22
- 支持hook在用户自定义条件成立时才生效 #23
- 添加lint检查并修复lint问题 #24
- 重构算子结果对比实现并支持输出相对误差 #26
- 支持精度对比时按数据类型自定义误差阈值 #27
- 添加使用说明和示例 #28
- 支持按算子名设置精度对比时的精度阈值 #30
- 精度对比时忽略随机数生成相关算子,忽略empty类算子(内存值为随机状态) #31
- 修复算子离线运行器的bug并完善测试 #29
- 更新使用文档 #33
- 支持算子工具结果以表格形式打印 #34
- 增强和重构autocompare #37
- 支持结果缓存管理 #38
- 支持 torch_npu的current_stram #39
- 修复dipu版本解析错误 #40
- 添加PyTorch测试 #41
- 添加PyTorch测试用例 #42
- 修复autocompare untyped_strorage 错误 #45
- 修复特殊类型(torch.return_types,torch.storage.UntypedStorage等)值的遍历bug #47
- 添加pytorch test3 #44
- 增加对算子输入是否被意外修改的检查 #49
- 大幅减小自动精度对比时的host内存占用和device内存占用 #50
- 支持精度对比和算子耗时测量时打印当前算子的用户层调用代码 #51
- 基于Torch原生测试用例改进测试逻辑 #48
- 自动精度对比时支持按算子自定义cpu计算使用的数据类型 #52
- 完善算子抓取工具并更新文档 #54
- 精度自动对比支持输出余弦相似性 #56
- 优化hook 垃圾回收逻辑 #57
- 添加进程监控工具 #58
- 修复ljx/sup op tools测试 #55
- 修复算子hook(贡献者: @caikun-pjlab) #60
- 重构部分代码以运行PyTorch原生测试 #59
- 将OpDispatchWatch重命名为OpObserve #62
- 增加溢出检测工具 #63
- 删除 main trigger (贡献者: @wugeshui) #64
- 修复resolve_name错误 #66
- 增强运行 pytorch 测试用例 #69
- 修复自动精度对比时内存泄露问题 #68
- 在国产设备上设备统一显示为cuda #70
- 添加ditorch和op_tool配置文件 #71
- 修复在torch.exp(x, out=x)等用法下autocompare报告输入被修改的问题 #72
- 精度溢出检测工具支持作用在非torch接口上 #73
- 重构ditorch目录结构 #76
ditorch v0.1.0 releasenote
大家好!我们很高兴的宣布ditorch仓库正式开源,并发布v0.1.0版本。
ditorch 是设备无关 torch, 旨在屏蔽各硬件厂商 torch 差异,为用户提供一致使用体验。通过 ditorch,开发者可以适配多个硬件算子库;此外,ditorch 提供训练过程中需要的基础工具,解决模型训练过程中出现的痛点问题。
版本
v0.1.0
核心功能
1. 可无感切换 pytorch 至国产芯片
2. 提供多个基础工具,解决训练过程的问题
| 序号 | 工具 | 简介 |
|---|---|---|
| 1 | 算子参数抓取工具 | 抓取模型真实训练过程中真实的输入输出 |
| 2 | 精度分析工具 | 进行离线和实时的精度分析 |
| 3 | 速度分析工具 | 可进行离线和实时的耗时分析,协助性能优化 |
| 4 | 算子 Fallback | 可将指定、全部算子在设备上运行的操作 fallback 到 CPU 计算 |