• 需求概述:英文標簽翻譯
• 數據總量:200000萬條(折合80萬字)
• 工期計劃:10個工作日
• 項目難點:數據量大、涉及行業多(醫療、軍 事、植物等)
• 項目里程碑:項目按期交付,并總結出更高效完備的翻譯流程,為二期三期項目奠定了基礎。
• 采集信息:2000個中國人——人臉數據
• 采集設備:手機不低于800萬像素,每個人臉照片不低于120*140像素
• 采集對象:2000個體,每人300張照片
• 采集環境:每年每人照片不少于50張,環境光線男女比例均勻分布
• 采集信息:“ xx同學”喚醒詞采集、語音采集
• 采集要求:每人錄制“xx同學”錄制30次,其中慢速10次,中速10次,快速10次。要求發音準確。
• 采集設備:iphone5及以上型號,安卓要求支持支持6.0以上的機型
• 采集對象:人數要求1000人,男女比例平均分布,要求18-50歲之間,普通話要求標準,僅可帶少許口音
• 采集環境:環境安靜,沒有雜音
• 采集設備:手機、行車記錄儀
• 采集對象:道路中的車輛(機動車、非機動車)、行人、車道線、紅綠燈、泊車位、交通指示牌等道路交通信息
• 采集環境:需涵蓋白天、夜晚、市區、高速等場景,各類場景按需求滿足比例
• 采集時長:14W小時,覆蓋4個一線城市,25個二線、三線城市
• 針對給定的語音片段,人工判斷其是否為有效語音,對于無效語音直接拋棄
• 按照切分-轉寫-保存的操作順序進行標注
• 有效性語音判別、時間切分和文本轉寫需滿足客戶規范
• 圖像來源:行車記錄儀
• 標注目標:車輛、路障、路燈、可行駛區域、對向車道等
• 對應信息標簽:標注目標的屬性信息
• 標注方式:語義分割
• 輸出結果:道路信息語義標注效果圖
• 需求概述:對所有可見區域內規范內的對象進行標注,通過3D內形狀與2D圖片共同判定
• 數據總量:100000張
• 工期計劃:此項目標注效率為1分鐘/框,每張圖15-20框,使用40人標注團隊,工期2個月