① 什麼是用來評估神經網路的計算模型對樣本的預測值和真實值之間的誤差大小
(損失函數)是用來評估神經網路的計算模型對樣本的預測值和真實值之間的誤差大小。
預處理是什麼 包括哪兩種方法:
資料庫基礎分析為什麼要進行預處理數據收藏做數據預處理很重要,但是如何做好數據預處理似乎是件更困難的事。
當今現實世界的資料庫極易受雜訊、丟失數據和不一致數據的侵擾,因為資料庫太大(常常多達數千兆位元組,甚至更多),並且多半來自多個異構數據源。
低質量的數據將導致低質量的挖掘結果。「如何預處理數據提高數據質量,從而提高挖掘結果的質量?如何預處理數據,使得挖掘過程更加有效、更加容易?」有大量數據預處理技術。
數據清理可以用來去掉數據中的雜訊,糾正不一致。數據集成將數據由多個源合並成一致的數據存儲,如數據倉庫。也可以使用數據變換,如規范化。例如,規范化可以提高涉及距離度量的挖掘演算法的准確率和有效性。
② 什麼是用來評估神經網路的計算模型
准確率、均方誤差、交叉熵損失。1、准確率:這是最常用的評估指標之一,衡量模型在測試集上正確預測的樣本比例。
2、均方誤差:MSE是一種常用的回歸任務的評估指標,衡量模型預測值與真實值的平均差異。
3、交叉熵損失:在分類任務中,交叉熵損失常用於衡量模型預測的概率分布與真實標簽間的差異。