帖子

《机器学习入门》学习笔记分享园地 | 讯飞AI大学

  [复制链接]
  • TA的每日心情
    开心
    2020-6-17 09:20
  • 签到天数: 15 天

    [LV.4]偶尔看看III

    2952191  楼主| AI小助手 发表于 2020-7-6 11:11:06 1#
    AI大学.jpg


    《机器学习入门》学习笔记分享园地

    内容简介:
    机器学习是实现人工智能最常见的一种方法,其能够赋予机器学习的能力,从而让它完成直接编程无法完成的功能。从实践的角度来说,机器学习就是通过对数据的利用,训练出模型,然后使用模型预测结果。
    本课程共含有48节课,从机器学习的一些基本概念讲起,进而介绍了机器学习的常见算法。比如:线性回归、逻辑回归、决策树、随机森林等,最后通过R语言和Python语言进行说明,介绍了各种算法在编程语言下的实现方法。

    PS: 本课程全英文授课,有字幕,不仅可以入门机器学习,还可以顺便练练自己的英语哦~


    科大讯飞A.I.开发者大赛火热报名中http://challenge.xfyun.cn/?ch=dxg (奖金池180W)

    定位人群:
    ①对机器学习感兴趣的同学
    ②有一定编程语言基础同学
    ③未来想从事人工智能相关行业的朋友

    课程时长:
    26天

    任务路线:
    • 基本概念
    • 常见算法,如线性回归、逻辑回归、决策树、随机森林
    • 梯度提升算法
    • 主成分分析(PCA)

    上课形式:
    已录制好的课程视频,大家一起在社群内打卡学习,互相交流,共同成长,如想入群,请扫描课程安排上的二维码,添加为好友。备注“机器学习”入群。

    报名时间:
    即日起至7月20日。

    开课时间:

    2020年7月中旬

    课程安排:
    机器学习入门 小助手.png




    渊易 发表于 2020-7-13 11:05:41
    2#
    留一法是确定性的,每次应用留一法到同一分类器及同一数据上,得到的结果都一样。而十折法是不确定的每次都不一样。
    使用道具 举报 回复
    177****6176 发表于 2020-7-13 15:10:24 来自手机
    3#
    #Day + 学习笔记 +07/13          今天了解了StatQues机器学习               机器学习中原始数据被称为训练数据      机器学习的主要内容 1、我们使用测试数据来评估机器学习方法      2、不要被机器学习方法与训练数据的匹配程度所愚弄   
    使用道具 举报 回复
    发表于 2020-7-13 17:04:44
    4#
    #Day 1-学习笔记-07/13:今天的主要学习内容是课程概述与交叉验证。在课程概述中,主要介绍了机器学习的用途:用于进行预测与分类。训练数据用于获得合适的模型,测试数据则用于判断该模型的准确度。评价一个模型的好坏在于所做的预测与测试数据相差有多大。
    交叉验证涉及到如何使用我们获得的数据。在课程中介绍的有K折交叉检验、留一交叉检验。对不同的机器学习方法进行交叉检验并进行对比,可以得出哪种方法更合适。
    使用道具 举报 回复
    188****6584 发表于 2020-7-13 20:12:48
    5#
    Day1:
    1. 机器学习思想:
           ·测试集评估性能
           ·不要看训练集表现得多好,要看测试结果
    2. bias-variance tradeoff
    3. 交叉验证:当不知道如何选取测试集时使用
           每一段都当测试集一次,分几段叫做几折交叉验证
           特殊:留一交叉验证,即每个数据都当做一个block
           可用于调参
    4. 混淆矩阵维数 = 分类类别个数

    使用道具 举报 回复
    189****9142 发表于 2020-7-13 21:01:57
    6#
    Day1 课程简介及机器学习基础
    1、交叉验证
    交叉验证可以比较不同的机器学习方法(逻辑回归、k近邻算法、支持向量机SVN等)
    2、混淆矩阵
    每一行对应于机器学习算法预测的内容。
    每一列对应于已知的事实。
    3、敏感性及特异性
    4、偏差及方差
    拟合曲线上的值与真实值的差就是偏差。
    不同数据集拟合得出的差异称为方差。

    使用道具 举报 回复
    183****3390 发表于 2020-7-13 21:21:47
    7#
    # Day 1+学习笔记+07/13
    一、课程简介:
    1. 基础概念
    - 训练数据:原始数据
    - 我们使用测试数据来评估机器学习方法,不要被机器学习方法与训练数据的匹配程度所愚弄。
    - 对训练数据拟合效果好,但预测不佳,这种现象称为偏差-方差权衡。
    - 机器学习就是为了进行预测和分类。
    - 机器学习重要的不是了解它们的奇妙之处,而是通过使用测试数据来决定哪种方法是适合我们的需求。

    2. 机器学习基础-交叉验证
    - 可以使用逻辑回归、K近邻或支持向量机算法来预测是否患有心脏病。但是究竟要用哪个算法,可以使用交叉验证来比较不同的机器学习方法。
    - 交叉验证:以十折交叉验证为例说明,将数据划分为十份,九份数据用于训练,一份数据用于测试,但是要将十份数据中的所有数据都测试一遍,
    也就是十份数据进行十次训练十次测试,所以每份数据都有机会用于训练,通过观察它们对测试数据的效果,来比较这些方法的优劣。

    使用道具 举报 回复
    188****6584 发表于 2020-7-13 21:56:34
    8#
    #Day + 学习笔记 +07/13  今日主要学习内容:
    1. 机器学习思想:
           ·测试集评估性能
           ·不要看训练集表现得多好,要看测试结果
    2. bias-variance tradeoff
    3. 交叉验证:当不知道如何选取测试集时使用
           每一段都当测试集一次,分几段叫做几折交叉验证
           特殊:留一交叉验证,即每个数据都当做一个block
           可用于调参
    4. 混淆矩阵维数 = 分类类别个数


    使用道具 举报 回复
    155****1852 发表于 2020-7-13 22:02:43 来自手机
    9#
    机器学习基础 方法:逻辑回归、K邻近算法、向量机、随机森林 交叉验证法: 估计方法的参数,即,使用逻辑回归。 训练算法:参数估计 评估方法的工作效果,即检测是否能良好的对新数据进行分类 算法测试:对方法的评估 1、训练方法 2、测试方法 前75%数据用于训练,后25%用于测试 四折交叉验证:将数据分成四分 留一交叉验证:每个样品单独测试 调优参数:估算不岀来,只能某种程度猜测 混淆矩阵: 数据划分训练集和测试集,适用交叉验证法每种方法效耒,为每种方法创建一个混淆矩阵每一行对应预测的内容。 敏感性及特异性: 敏感性:算法正确(左上)识别有的百分比特异性:算法正确(右下)识别没有的百分比 分块矩阵,依次计算 敏感性:单个正确的百分比 特异性:除去单个的分块矩阵的正确百分比 偏差及方差 偏差:只限无法捕捉的真实关系
    使用道具 举报 回复
    155****1852 发表于 2020-7-13 22:05:50 来自手机
    10#
    #Day + 学习笔记 +07/13       机器学习基础              方法:逻辑回归、K邻近算法、向量机、随机森林 交叉验证法: 估计方法的参数,即,使用逻辑回归。 训练算法:参数估计 评估方法的工作效果,即检测是否能良好的对新数据进行分类 算法测试:对方法的评估 1、训练方法 2、测试方法 四折交叉验证:将数据分成四分 留一交叉验证:每个样品单独测试 调优参数:估算不岀来,只能某种程度猜测 混淆矩阵: 数据划分训练集和测试集,适用交叉验证法每种方法效耒,为每种方法创建一个混淆矩阵每一行对应预测的内容。 敏感性及特异性: 敏感性:算法正确(左上)识别有的百分比特异性:算法正确(右下)识别没有的百分比 分块矩阵,依次计算 敏感性:单个正确的百分比 特异性:除去单个的分块矩阵的正确百分比              
    使用道具 举报 回复