Author: haoransun
WeChat: SHR—97
图片&知识点来源:CS231N
写代码是热爱,写到世界充满爱
Author: haoransun
WeChat: SHR—97
图片&知识点来源:CS231N
我们知道,深度学习模型-CNN是一个黑箱子,我们只知道他能够Work,但是不知道他为什么能Work,不知道中间的那些层他们之间的关系是怎样的。
1980年美国军方斥巨资进行了一项研究,草地上的坦克是真的敌方坦克还是充气玩具。这个军事意义非常大,在诺曼底登录时,德军就是被英美联军的充气坦克给蒙蔽了,误以为盟军要进行加莱
最后发现巴顿将军登陆了诺曼底,巧妙的避开德军重兵防守的一些区域,所以甄别坦克真假是极其重要的。当时的美国国防部采用了很多白天敌方坦克的真实图像,又用了晚上的充气玩具假坦克的图像进行训练,训练完之后发现在测试集上的准确率是100%,模型怎么这么成功!他们就拿到五角大楼去炫耀。后来知道他们并不是得到识别真假坦克的分类模型,而是识别到了白天和晚上的模型。神经网络误以为我们要学习的是白天还是夜晚,而不是真假坦克。
由此可见,对于一个黑箱子,我们要彻底把它了解透彻,才不会闹这样的笑话。
Author: haoransun
WeChat: SHR—97
知识点来源:B站
很多刚入行或者还在读研的小伙伴的目标一直局限在算法上,总是觉得做出了一个机器学习模型是重中之重,觉得企业就应该等自己加入,然后提供一个巨牛逼的算法,把你的模型放进现有公司的系统当中,然后就能带领公司的业绩一路飞黄腾达,今儿呢给大家来一碗毒鸡汤。
对于一个刚入行的同学来说,跳出算法好好的当一个工程师比什么都重要。机器学习AI的落地过程中,有许多至关重要的工作都是在算法之外的。先是一个工程师,你才是一个算法工程师。我更倾向于目标是算法岗的同学们,把自己的成长目标换成是具备机器学习理论和工具使用经验的后端工程师。
机器学习的落地远远不止是一个fit,然后predict,然后就完了。从数据采集到最后的模型部署,有许多许多环节,甚至在一个完整的机器学习项目当中,离线训练甚至都不是最重要的,他对最后的产出影响也不是最大的。
假设你还没有毕业或没有参加过工作,我简单列举一下一个通用的机器学习落地项目当中会涉及到的几个重要的组成部分。咱们来一个一个来。
教材仔细读:经过长时间的打磨,是精品;书籍如CSAPP, ESL, MLAPP, GEB(最后这个花费作者一辈子心血)
论文要甄别:
⚠️:只有一小部分的文章值得复现,如顶会论文的best paper 或 oral;
⚠️:经典的论文在你之前可能已经有很多人复现过了,作者也可能会给出官方的代码;
⚠️:硕士、高年级的本科生、刚入门者这些垃圾可以不用读;但博士生为了在这个特别小的方向上能有所建树、保持敏锐的嗅觉,这些垃圾也要读,宁滥勿缺。
Author: haoransun
WeChat: SHR—97
图片&知识点来源:B站
1. IEEE & IEEE trans
IEEE: Institute of Electrical and Electronics Engineers。世界上最大的电子电器工程师协会。
IEEE trans:IEEE协会出版的会刊。
2. A类、B类、C类指的是什么:
一般是说CCF(中国计算机学会)推荐的高水平期刊会议,平时说的CCF A,CCF B,CCF C,其实这里的ABC就只是CCF给一些论文的评级。
注意:CCF收录的论文数量还是有限的,没有CCF等级的论文不一定代表着它质量就不好。
相传发一篇A,你就可以博士毕业了。
tag:
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true