在数据管理环节,言犀能够通过智能标注模型、数据增强模型、数据转换工具集,帮助模型开发者实现数据导入、清洗、标注以及增强所有环节,支持多种文件格式的数据导入和智能解析、提供自动、半自动的数据标注能力。帮助解决数据环节存储分散、数据格式不一、数据质量参差不齐、人工标注数据效率低等问题。 在分布式训练环节,言犀平台适配国产硬件,支持 HPC,集成高性能文件系统;提供资源的分配调度策略,保证硬件资源被充分利用;提供统一的交互接口,简化训练任务的管理。帮助解决网络和算法的复杂度快速增长,带来计算资源的稀缺和浪费;HPC、高性能计算、高性能文件系统、异构硬件的使用和适配困难;模型训练的多样性,训练学习成本提高等问题。 无代码开发能力方面,则进一步简化产大模型开发过程。用户能够直接选择平台内置的大模型,上传数据后,之后继续选择训练方式,指定超参和 AutoML 两种无代码训练方式之一后,得到一个微调模型或者应用。 在应用层,言犀平台内置了问答开发、文档分析开发、插件开发等常用应用场景的无代码开发工具。选择模型、知识库、Prompt 模版以及开发平台后,一键部署。并且能够支持监控、追踪测试以及测试评估。