本文整理了兩篇論文中的相關內容,並重點探討 Label Smoothing 的概念、實現方式與效益。兩篇論文分別是:
About 5 min
本文整理了兩篇論文中的相關內容,並重點探討 Label Smoothing 的概念、實現方式與效益。兩篇論文分別是:
資料清洗(data cleaning)是指對數據集進行處理,以確保其質量和一致性,使其適合用於分析、建模或其他目的。在資料集中檢測和糾正(或刪除)損壞或不準確的記錄進行處理,辨識出資料的不完整、不正確、不準確或不相關部分,然後替換、修改、或刪除髒資料或(raw data)。在人工智慧(AI)和機器學習領域,資料清洗是非常重要的一步,因為高質量的數據是訓練高性能模型的基礎。
正式存入數據庫之前,都要進行「數據清洗」,以確保數據的正確性、一致性、可驗證性、完整性、相依性等等。