Sockeye 是一个基于 Apache MXNet 的快速而可扩展的深度学习库。Sockeye 代码库具有来自 MXNet 的独特优势。例如,通过符号式和命令式 MXNet API,Sockeye 结合了陈述式和命令式编程风格;可以在多块 GPU 上并行训练模型。
目前 Sockeye 发布了 3.1.18 & 3.1.29 版本,分别带来如下改动:
[3.1.28]
从 Khandelwal et al., 2021 添加了 kNN-MT 模型,
安装:参见 faiss 文档,推荐通过 conda 安装。
从 sockeye 模型构建 faiss 索引需要两个步骤:
- 生成解码器状态:
sockeye-generate-decoder-states -m [model] --source [src] --target [tgt] --output-dir [output dir]
- 构建索引:
sockeye-knn -i [input_dir] -o [output_dir] -t [faiss_index_signature]
,其中 input_dir 与sockeye-generate-decoder-states
命令中的 output_dir 相同。
Faiss 索引签名参考:参考此处
- 使用内置索引运行推理:
sockeye-translate ... --knn-index [index_dir] --knn-lambda [interpolation_weight]
,其中 index_dir 与sockeye-knn
命令中的 output_dir 相同。
[3.1.29]
- 运行 sockeye-evaluate 不再对 TER 应用文本标记化(与其他指标相同的行为)。
- 为除 test_utils 之外的所有 sockeye 模块打开类型检查,并解决了由此产生的类型问题。
- 在不改变用户级行为的情况下,重构各种模块中的代码。
更新公告:https://github.com/awslabs/sockeye/releases/tag/3.1.29
还没有评论,来说两句吧...