Google科学家最新整理,给新手推荐的十篇优秀数据科学文章
如果你想画一条线,祝贺你!你刚刚发明了一种机器学习算法,它的名字是……感知器。是啊,这么简单的东西居然有这么一个科幻名字!请不要被机器学习中的行话吓倒,它通常不应该受到这个名字所激发的震惊和敬畏。 机器学习算法的目的是选择最合理的位置来放置围栏,它根据数据点到达的位置来决定这一点。它是怎么做到的?通过优化目标函数。 优化 目标函数(损失函数)类似于棋盘游戏的点系统。目标函数就像一个棋盘游戏的得分规则,优化就是找出如何玩,这样你就可以获得最好的分数。 ML 中的目标函数倾向于称为「损失函数」,目标是最小化损失。 损失函数就像一个棋盘游戏的得分规则,优化它就是找出如何玩,这样你就可以得到最好的分数。 你希望得到的解决方案是这样的: 模型 一旦围栏就位,算法就完成了,你从中得到的就是你想要的——一个模型,它只是配方的一个花哨的词。 标签 一旦你把你刚铸造的模型投入生产,你就可以通过给计算机输入年龄和分数来使用它。系统会查找对应的区域并输出标签。 当我得到四杯新茶时,我只需将它们的输入数据模型进行匹配,并相应地标记它们。看到了吗?很简单! 如果你期待魔法,那么,你越早失越好。机器学习可能是平淡无奇的,但你能用它做一些不可思议的事情!它可以帮助你编写自己无法想到的代码,能够自动处理无法表达的代码。不要因为简单而讨厌它。杠杆也很简单,但它们可以翘起地球。 文章地址: 20 世纪 20 年代的深刻见解催生了你今天遇到的大多数统计研究。 我们收集的证据使我们的无效假设看起来荒谬?不是开玩笑,这就是一切。经典假设检验就是这样。 这里来举个例子:假设检验与外星人。 你刚刚被选入参加终极冒险:寻找行星寻找外星生命。不幸的是,你的经理给了你一个微不足道的用户界面。它只有两个按钮:是和否。 这是整个控制面板。是表示这里有外星人,否表示这里没有外星人,无法输入评论。 更糟糕的是,你的经理没有给你预算去搜索整个星球。你所能做的就是着陆,选择一个方向,开始行走直到你的氧气供应变得不稳定,然后回头按这两个按钮中的一个。你将面临不确定性:你可能最终不知道真正的答案是什么。 在这个例子中,你需要进行收集数据,统计、分析以解决问题。分析关注的是存在的情况,而统计关注的是不存在的情况。 我们在行走中没有看到外星人,我们的无效假设是地球上没有外星人。我们对这个大测试问题的答案是什么?证据会让我们的无效看起来很荒谬吗?怎么可能?样本中没有一个外星人。 现在想象一下,如果我们不是在路上看到外星人,而是看到这个绿色的小家伙。 假设那是外星人(而不是泡菜),我们学到了什么?如果我告诉你我观察过这个外星人,我还在考虑这个星球上没有外星人生命的可能性,你会告诉我你观察过一个白痴。 这个证据让我的无效假设看起来很荒谬!当证据使假设看起来荒谬时,我们该怎么做?我们不应该固执己见。把它扔掉! 我们总是巧妙地设计我们的两个假设,使它们跨越所有的可能性,拒绝一个接受另一个。 如果我们的证据让我们的回答是「是」,我们就拒绝这个荒谬的假设,并作出有利于选择的结论。我们现在对执行默认操作感到可笑,所以我们切换到另一个操作并按 Yes。所以我们已经从整体上了解了这个星球:它上面有生命! 总而言之,假设检验的游戏就是确定我们收集的证据是否会让我们的无效假设看起来荒谬。一切都取决于我们如何根据证据改变主意。 #7 TensorFlow 死了,TensorFlow 万岁!文章地址: 欢迎使用TensorFlow 2.0,这是一场革命! 这是一次彻底的改头换面。如果你是 2019 年年中的一个 TF 初学者,你就非常幸运了,因为你选择了进入人工智能的最佳时间。 我怀疑很多人抱怨 TensorFlow 1.x 很容易让人上瘾。它是人工智能的温床,而且非常人性化。充其量,你可能会为能够以令人难以置信的规模完成你的人工智能任务而感到感激。 可爱的 Keras Keras 是一种可与多个机器学习框架逐层构建模型的规范,它不是 tf,但你可能知道它是从TensorFlow中作为 tf.keras 访问的高级API。 Keras 从一开始就被建造成 python 使用,它一直以人为本,具有吸引力和灵活性,且简单易学。 TensorFlow 已经死了,TensorFlow 2.0 万岁! (编辑:应用网_丽江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |