在紫光股份旗下新华三集团以“×AI”为主题举办的2024媒体与分析师沟通会上,新华三集团高 级副总裁、云与计算存储产品线总裁徐润安指出,在万物与AI融合发展的当下,新华三要做开放平台,不仅是GPU、CPU和存储开放,管理工具和管理方式也要拥抱AI。
没有数据就无法训练,AI时代的大门便无从开启。新华三推出的绿洲大模型数据治理平台能够通过异常清洗、过滤、去重、去隐私、语料增强、多维评估等流程将原始数据转化为训练数据,并对结构化数据、文本、图片、音视频等多模态数据进行高效管理,覆盖AI数据应用的全流程、全生命周期。
平台内置了50+数据预处理算子,可通过分布式并行计算和向导式指引将数据治理效率提升10倍。而多维度的实时数据质量反馈机制则能让数据治理过程步步为营,使经过处理的数据集质量提升30%。