官方表示,當前,大模型正處在產業(yè)落地前期,高質量的數據,是大模型實現產業(yè)化的關鍵要素。
對于以ChatGPT、文心一言為代表的生成式AI,海量的數據訓練、人工標注、指令微調、基于人類反饋的強化學習(RLHF),可以讓大模型與人類價值觀、思維方式不斷對齊,使大模型更加可用。
據介紹,為保障數據標注質量,百度智能云搭建了全流程數據服務人才梯隊,?跀祿䴓俗⒒噩F擁有數百名專職大模型數據標注師,標注師的本科率達到100%。
百度智能云方面表示,目前已經在全國與各地政府合作,共建了十多個數據標注基地,累計為當地提供超過1.1萬個穩(wěn)定就業(yè)崗位,間接帶動5萬人就業(yè)。