• <li id="gswm4"><xmp id="gswm4"><input id="gswm4"><em id="gswm4"></em></input>
  • <s id="gswm4"><em id="gswm4"></em></s>
    • <s id="gswm4"><em id="gswm4"></em></s>
      首頁 > 財經 >

      上海人工智能實驗室發布多模態語料


      (資料圖片)

      人民日報上海8月15日電 (記者沈文敏)近日,上海人工智能實驗室宣布聯合語料數據聯盟成員單位,共同開源發布“書生·萬卷”1.0多模態預訓練語料。

      “書生·萬卷”1.0集合了語料數據聯盟成員豐富的內容積累與上海人工智能實驗室的數據處理能力等優勢,將為學術界及產業界提供高質量大模型多模態預訓練語料。本次開源的數據總量超過2TB,具備多元融合、精細處理、價值對齊、易用高效等四大特征。

      本次開源的“書生·萬卷”1.0包含文本、圖文、視頻三部分數據集。其中文本數據來自網頁、百科、書籍、專利、教材、考題等,數據總量超過5億個文檔,數據大小超過1TB,覆蓋科技、文學、媒體、教育、法律等多個領域;圖文數據主要來自公開網頁,經處理后形成圖文交錯文檔,總量超過2200萬個,數據大小超過140GB(不含圖片),覆蓋新聞事件、人物、自然景觀、社會生活等多個領域;視頻數據主要來自中央廣播電視總臺和上海文廣集團,包含新聞、影視等多種類型的節目影像,總計視頻文件數超過1000個,數據大小超過900GB,內容覆蓋軍事、文藝、體育、自然、知識、影像藝術等方面。

      關鍵詞:

      責任編輯:Rex_16

      推薦閱讀
      91亚洲精品色午夜麻豆,91美女在线视频,性欧美tube精品,久久99精品久久久久久野外
    • <li id="gswm4"><xmp id="gswm4"><input id="gswm4"><em id="gswm4"></em></input>
    • <s id="gswm4"><em id="gswm4"></em></s>
      • <s id="gswm4"><em id="gswm4"></em></s>
        主站蜘蛛池模板: 国产精品美女久久久久| 久久丫精品久久丫| 亚洲av无码一区二区三区观看 | 无码日韩精品一区二区三区免费| 夜夜高潮天天爽欧美| 国产亚洲美女精品久久久| 亚洲国产精品综合久久网各| 一级毛片**免费看试看20分钟| 4hu四虎最新免费地址| 欧美视频在线观看免费| 欧美日韩精彩视频| 好爽好紧好多水| 四虎影视1515hh四虎免费| 久久综合88熟人妻| 青青操视频在线免费观看| 波多野结衣视频在线免费观看| 成人午夜福利电影天堂| 国产免费内射又粗又爽密桃视频| 亚洲乱码中文论理电影| 99re6在线精品视频免费播放| 精品久久久久久久久中文字幕 | 羞羞社区在线观看视频| 日本特黄特色aaa大片免费| 国产日韩欧美亚洲| 亚洲免费观看在线视频| 2022国产精品视频| 欧美第一页草草影院浮力| 夜夜爽77777妓女免费看| 亚洲精品乱码久久久久久自慰 | 67194熟妇在线观看线路1| 波多野结衣伦理视频| 天堂网在线观看| 免费国内精品久久久久影院| 东北女人下面痒大叫| 美女被奶乳羞羞漫画在线| 无码人妻aⅴ一区二区三区| 国产区精品一区二区不卡中文| 亚洲av无码专区国产不乱码| 青青青青久久久久国产的 | 亚洲日韩av无码中文| 97热久久免费频精品99|