AI领域将面临数据墙:高质量语言数据枯竭
快科技8月1日消息,据媒体报道,目前互联网高质量数据枯竭,AI领域面临“数据墙”。对于AI大模型公司来说,现在的挑战是找到新的数据源或可持续的替代品。据权威研究公司EpochAI的前瞻性分析,至2028年,互联网上的所有高质量文本数据或将被悉数采撷,而机器学习所依赖的高质量语言数据集,其枯竭的时间点甚至可能提前至2026年。这一“数据墙”的预言,无疑在AI行业内投下了一片阴影,成为制约其快速发展的重大瓶颈。然而,面对这一看似绝望的局面,部分科学家却持有更为乐观和宽广的视角。他们认为,断言“人工智能模型正步入数据枯竭的绝境”过于悲观且片面。在语言模型的细分领域内,仍有一片未被充分探索的数据蓝海,蕴藏着丰富的差异化信息,等待着被挖掘利用,以驱动更加精准、定制化的模型构建。为了跨越“数据墙”的障碍,AI界正积极探索多