① 什么是用来评估神经网络的计算模型对样本的预测值和真实值之间的误差大小
(损失函数)是用来评估神经网络的计算模型对样本的预测值和真实值之间的误差大小。
预处理是什么 包括哪两种方法:
数据库基础分析为什么要进行预处理数据收藏做数据预处理很重要,但是如何做好数据预处理似乎是件更困难的事。
当今现实世界的数据库极易受噪声、丢失数据和不一致数据的侵扰,因为数据库太大(常常多达数千兆字节,甚至更多),并且多半来自多个异构数据源。
低质量的数据将导致低质量的挖掘结果。“如何预处理数据提高数据质量,从而提高挖掘结果的质量?如何预处理数据,使得挖掘过程更加有效、更加容易?”有大量数据预处理技术。
数据清理可以用来去掉数据中的噪声,纠正不一致。数据集成将数据由多个源合并成一致的数据存储,如数据仓库。也可以使用数据变换,如规范化。例如,规范化可以提高涉及距离度量的挖掘算法的准确率和有效性。
② 什么是用来评估神经网络的计算模型
准确率、均方误差、交叉熵损失。1、准确率:这是最常用的评估指标之一,衡量模型在测试集上正确预测的样本比例。
2、均方误差:MSE是一种常用的回归任务的评估指标,衡量模型预测值与真实值的平均差异。
3、交叉熵损失:在分类任务中,交叉熵损失常用于衡量模型预测的概率分布与真实标签间的差异。