参加CCF-GAIR(2018)的体验总结

warming-up video, 推荐观看~❤


  • CCF-GAIR,全球人工智能与机器人峰会,由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办。
  • 一年一度的人工智能分享大会,2018年是第三届。
  • CCF-GAIR 2018 提供1个主会场和11个专场:

2018届参会的价值:

  • 三天的行程,11个专场,基本涵盖目前人工智能的应用场景
  • 每个专场的演讲内容很厚实,100多位演讲嘉宾都是实打实的厉害,图灵奖得主、中科院院士及藤校教授等
    具体的嘉宾可参阅:CCF-GAIR 2018 官网

接下来就按照我pick的专场来进行学习和总结:

正文 - 参加 CCF-GAIR 的笔记

[AI前沿专场] ===========================

走向真正的人工智能 (张钹,中国科学院院士,清华大学教授)

中心思想:现在离真正的人工智能还有一段很长的路
目前人工智能取得成功的因素:

  • 大数据
  • 计算能力提高
  • 优秀的算法
  • 必须建立在合适的应用场景下

目前的人工智能的实现有5个限制:(重点!!📍)

  1. having rich data or knowledge
    丰富的数据或者知识(关于这点不能同意更多!没数据就叫你建模的都是耍流氓!!)
  2. certain information 确定性信息
  3. perfect information 完全信息
  4. ‘static’ 静态的
  5. single task and finite domain
    单任务,有限领域(AlphaGo也只会下象棋而已嘛!人能做的太多太多了)

张钹:

  • 大家常常关心什么样的工作会被机器所替代,我可以明确告诉大家,满足这 5 个条件的工作,总有一天会被计算机取代,就是那些照章办事,不需要任何灵活性的工作。
  • 为什么有这 5 个限制?原因在于我们现在的人工智能是没有理解的人工智能。
  • 智能体现在推理能力上。但是很不幸,现在的对话系统推理能力都很差。基本做法是建立一个常识图谱,用这个图谱帮助理解提出的「问题」,同时利用常识图谱帮助产生合适的答案。
  • 这种通过数据驱动做出来的系统,它的性能跟人类差别非常大,鲁棒性很差,很容易受干扰,会发生重大的错误,需要大量的训练样本。
  • 这样的系统只是一个机械的分类器,根本不是感知系统。
  • 人类的最大的优点是「小错不断、大错不犯」,机器最大的缺点是「小错不犯,一犯就犯大错」
  • 大家为什么这么重视人工智能?因为我们永远在路上,这就吸引我们去解决这些问题,这些问题一旦解决了,人类的社会进步、人类的生活就会发生本质上的改变。

AI赋能,人机共融 (张建伟,德国汉堡科学院院士,汉堡大学多模式系统研究所所长,国家千人计划专家)

单模态学习应用 (推荐《机智过人》节目,寓教于乐)

  • 图像处理中,对于模糊的图像,人类在模糊信息下运用知识、运用外推的能力强于机器人
  • 看图写诗:微软机器人小冰
  • 声音的单模态学习
  • 机器人阅片,医疗运用,机器人在有限环境里的大数据学习能力非常强

跨模态学习应用

  • 跨模态的动态适应机制
    例如,通过发现老鼠在学习前和学习后的神经元的变化,希望总结出未来更好的带有局部记忆的深度神经模型。
  • 跨模态的泛化和预测
  • 跨模态的人机交互方面
    如何让机器人通过视觉、语言的共同学习,更好地理解概念,理解他们中间的关系。
  • 通过多模态的学习,包括未来的制药、科学实验,都可以通过机器人进行大量的加速,在机器人应用比较典型的瓶颈问题里,通过多模态的学习实现了机器人的灵巧操作,包括抓取、注射等等。

未来关键技术举例

  • 区块链技术产生可靠学习数据
  • 日常复杂环境的快速理解
  • 柔性轻型机器手臂和灵巧手的设计
  • 基于传感的精细灵巧操作
  • 机器人高层知识的获取和学习
  • 自然人机交互
  • 跨平台运行的开源软件

Driving Safety and Autonomy through Advanced Sensing Technologies and Efficient Big Data Analytics
(Mircea Gradu,2018 汽车工程学会(SAE International)主席,Velodyne LiDAR 高级副总裁兼CQO)
  • 这个video展示了Velodyne LiDAR在自动驾驶上技术实现的可视化情况

Rethinking Deep Learning: Back to the Challenges of Computer Vision
(马毅,加州大学伯克利分校电子工程与计算机系教授, ACM 、IEEE Fellow)

这是整场大会100多大牛里我最喜欢的嘉宾,不是因为他title最高或者是颜值最高,而是因为他敢于表达自己的观点,能跳出圈子思考
先放出他的观点:
Can we all please agree:

  • With back-propagation and sufficient computation cost, deep models can fit or over-fit any finite (polynomial #) samples.
  • So-learned models are useful when such finite samples cover almost all cases of interest or importance.

But let us be honest that:

  • Wishful designs and empirical validations are not mathematical proofs.
    (however big data are always negligibly small to infinity!)
  • Learning is about finding the simplest generative model from finite samples.
    (without which there is no “stability, robustness, invariance, or generalizability”.)

And also realize that:

  • Deep networks are trying to find low-dimensional structures, too!
    (hence the theory of subspace, sparsity, low-dimensional models is foundational.)


下面说一下我的总结:

关于深度学习
预先科普,按照顺序是前者包含后者:人工智能-机器学习-深度学习
也就是,机器学习是人工智能的一个分支,深度学习是机器学习的一个分支。

作为一个数学出身的工程师,我非常理解并且比较赞同马毅老师对待深度学习的观点。就是不盲目的崇拜深度学习。
现在的深度学习,各种神经网络的火爆,是没有完整的数学论证作为支撑的。而是放在现实场景中比较好用,比如人脸识别,就这么被大众以及学术圈子接受了。但是图像做细微肉眼不可见的改动,机器可能就识别不出人还是狗,人却一定不会犯这么低级的错误,深度学习它的不可解释性或者弱解释性还是它的痛点。

  • 深度学习是“经验”的学习与应用,而传统的像压缩感知(compressed sensing)往往是严谨的数学建模,即所谓的model-based。
  • 深度学习有些部分其实是根植于传统的模型与方法,像经常提的dropout扔参数,其实也是稀疏性的一种体现。
  • 深度学习的有些东西就是传统的机器学习,只不过是换了一个名字而已。像经常提到的前馈、反馈,尤其是根据结果往前推的反馈不就是机器学习里面的监督学习吗?前馈一直往前走,相当于没有利用标签信息,不就是无监督学习吗?
  • 深度学习网络层数越深越好的观点值得商榷,PCANET就是一个例证(没看过…)。深度学习深的应该是理论,是理解,而非单纯的加层数。
    马老师讲了一句爱因斯坦老人家的话,大概是”Everything should be made as simple as possible, but not simpler”

但是话又说回来,与其等待解释性更强的算法达到更好的性能和效果,现在的深度学习都是未来优秀算法的垫脚石,如果不能一步到达未来,那不就应该先利用现有的资源做现在能做的事吗?

关于考古、文献阅读
我们现在一般只读最新的文献,马老师的一个观点也非常值得思考:你想到的、遇到的问题老祖宗可能早就想到、遇到了,甚至可能给出了还不错的解法!也就是说,我们读文献的时候不要仅仅局限于新文献,也去尝试一下老一点的甚至50、60年代的文献,虽然处理的问题很可能完全不同,但这并不代表着我们不能从旧文献中获得启发。不要重复造轮子,就是这个意思吗?

关于思考
物理有质量守恒,数学有难度守恒。
同时,作为一个技术人员,表达能力十分重要,与别人分享,首先要引起别人对你的项目的兴趣、共鸣,其次能够解释明白思路与框架,最后要敢于表达自己的观点。而且在开发算法或者开发模型的时候,不能一头扎进去沉迷算法结构的优美,而是时不时要出来审度,思考应用的场合,方向和远见有时候更重要。
很喜欢马毅老师这种对万事保留理性的质疑的态度,做数学的就是要有这种强迫症才可爱吧😝


[仿生机器人专场] ===========================

仿生粘附和软微型机器人
(Metin Sitti ,德国马克斯普朗克智能系统研究所的物理智能部门元老级成员及负责人,nanoGriptech 公司创始人,原卡内基梅隆大学的机械工程学教授)

他首先介绍了自己早期关于壁虎的黏着原理的仿生学研究。壁虎的指头上有纤维,提供了很强的吸附力,而不需要像昆虫一样需要黏液,是一种干性黏性。
迷妹角度❤❤

视频内有一个小虫子一样的不明物体对不对~~
这是一种大约七分之一英寸长的机器人,它首先看起来只不过是一条橡皮状的小条状物。然后它开始移动。
它可以走路,跳跃,爬行,翻滚和游泳。它甚至爬出游泳池,从水环境变成干燥的环境。具体操作可以点击下面的视频:

  • 机器人原型足够小,可以在胃或泌尿系统中移动。
  • 该机器人尚未在人体中进行过测试,但其目标是改善其用于医疗用途。 例如,将药物输送到体内的目标。
    比如服用药物后,药物能直接跑去你体内伤口或者需要药物的地方,而不是散落在肠胃的各处。

Sitti博士说,这项研究最不寻常的是,这种“极简主义机器人”可以实现“在复杂环境中导航的所有不同类型的运动可能性”。

接下来总结一下这个小机器人的存在意义,别看体积小,其实挺有趣也挺有用的:

机器人是由什么构成的,它是如何工作的?

Sitti:机器人由弹性橡胶制成,里面充满了许多磁性小颗粒。编程可以操作这些粒子的磁性,以便从外部,当我们施加磁场时,弹性鞘形机器人将其形状改变为我们想要的任何东西。

然后它做所有这些不同的动作。当你看到这个小东西爬行和跳跃以及所有这些东西时,它看起来像一个生物。

这个机器人的未来在哪里?

Sitti:目前的主要目标之一是将这个微小的软机器人放入我们的消化系统或泌尿系统 - 以及将来的血管系统 - 并使其能够在所有这些复杂的组织中导航,这些表面完全充满了流体或半填充,或无流体。

如果你看一下我们所拥有的医疗设备,最小的是直径为毫米的导管,它们总是被束缚住。因此,制造这个小型机器人的主要目标是真正进入我们体内难以触及甚至不可能到达的区域,并且侵入最小。

机器人已经足够小,可以用于我们的消化系统和泌尿系统。我们想要更小,甚至几十微米,这样我们几乎可以到达你体内的任何地方。

有朝一日这个小机器人能够提供药物?

Sitti:我们一直在探索的功能之一是如何在体内输送可能是药物的货物。有不同的方式。通过改变形状,我们可以抓住货物,然后通过打开形状来交付货物。

第二种方式是我们在机器人上做一个小口袋,只打开一个我们可以控制的特殊形状变化。

灵感来自水母,毛毛虫和其他动物的运动?

Sitti:基本上,我们采取了所有这些灵感,并将它们合并为一个机器人。这是我们在这项研究中解决的另一个科学挑战:如何将毛虫,水母和所有这些不同的,小的,柔软的生物结合到一个相对极简主义的机器人中,可以实现在复杂环境中导航的所有不同类型的运动。

如果它在体内迷失了怎么办?

Sitti:这个版本作为一个整体机器人不是完全可生物降解的。我们正在研究的一个项目是制造一个完全可生物降解的机器人。最后,机器人将被身体溶解,没有副作用,没有毒性,也没有任何材料会导致身体出现任何问题。
这是我们小组的主要目标之一。这是可能的。我的意思是,我们的弹性体在体内完全可降解。我们的磁性纳米粒子可在体内完全降解。这只是整合它们的问题。


智能仿生机器鱼 (谢广明 ,北京大学工学院教授)




能实现后空翻/垂直旋转的鱼:

实现机器鱼群:

详细链接🔗

机器人比较好理解,有没有跟我一样好奇机器鱼是干嘛用的?
鱼跟海洋有密不可分的关系,目前的仿生鱼能做到的有:

  • 自动带回指定海洋域的水样本,供水质检测用,就不需要人划船过去采水样了
  • 能带领生物鱼群游动,在捕鱼期间,可以放出所需鱼群样子的鱼把生物鱼群带领到捕猎区域,可以有效筛选掉不需要的鱼种。当然基于合理捕猎的范围。
  • 装有摄像头的鱼可以日常监控海洋可见范围内的情况
  • 做海洋的清洁工,把人类丢进去的大量垃圾回收,尤其是将塑料袋/塑料瓶这种不可降解物带离海洋生物
  • 仿生鱼可大可小,也可以做的很大

由于对海洋有莫名的喜欢,所以还是很期待仿生鱼的应用的。
同时,开发出越强大的仿生机器,就越感慨造物主的伟大!无论我多么热爱科技,也比不上我热爱大自然~


仿人机器人关键技术研究 (熊蓉,浙江大学智能系统与控制研究所机器人实验室主任)

详细链接🔗


当前智能机器人发展若干挑战性问题 (王田苗,北京航空航天大学教授,长江学者特聘教授)

详细链接🔗


[AI+专场] ===========================

机器学习的可解释性与自动机器学习
(胡侠 ,美国德州农工大学数据挖掘实验室主任、计算机学院终身教职系列助理教授)

这是三天里我最感兴趣的一场了,上干货!

胡侠教授表示,机器学习要被各行各业普遍接受和应用,前提是要具有可解释性。

但是赋予机器学习可解释性是一个非常难的问题。第一,可解释性没有明确的定义,可能是系统的可解释性,也可能是预测结果的可解释性,甚至可能是系统中某一个部分的可解释性。第二,如果做深度学习的可解释工作,现有的深度学习系统千千万,我们没办法对每一个系统都做。第三,让机器学习系统具有可解释性,必须大量HCI、Visualization专家跨学科合作,是一项巨大的挑战。

下面这个视频是一个分类模型的可视化界面,类似决策树/boosting的样子,可以手动增加/删减树的节点,还挺好玩的:

为解决这个问题,胡侠教授提出,将性能强大、不可解释的深度学习系统学到的知识,迁移到性能较弱但可解释的浅度学习系统中。
更多机器学习的可解释性信息链接🔗

接下来重点整理下自动机器学习(auto ml)的笔记:

  • 首先介绍什么叫做自动的机器学习(Auto Machine Learning)

目前无论是开发一个机器学习模型,还是招人开发一个模型,经济成本和时间成本都是相当可观的。因此假如有一个框架提供自动的机器学习服务,无需你有超级专业的建模知识,只需要你把数据丢进去,它自动帮你加工数据,自动遍历模型建模,甚至一小时内自动跳出最优的模型结论,岂不是妙哉?
这就是 Auto ML 干的事~

比如像下面这样:
下图是最原始、最简单的机器学习系统。我们有一组数据,想知道它是文本还是数值,具体是用Text mining、Classification还是Regression。如果用Classification,效果还不错,系统就会推荐给你。这是最原始的现有产品能实现的功能,给定一些数据后可以推荐相应的系统给大家。

  • 胡侠教授他们的工作内容与成果:

他们挑选了约300个UCI的数据,重新采样形成了4000个数据。然后把能找到的20多个分类的package全部应用到这4000个数据上去,观察效果如何。新的数据进来后,他们就找出矩阵中和新数据最像的Dataset,将这个Dataset上历史表现最好的模型推荐给用户。通过这种方法,将机器学习效果提升了很多。

他们目前正在做的工作是研究怎样做好神经结构的搜索。有了数据后,系统可以自动推荐一个相应的深度学习结构给该数据。在没有资源,没有大量深度学习工程师和数据科学家的情况下,这样一个结构或许可以初步满足初创公司、社会学科和医生的数据探索需求。

第一步,要根据相应模型,通过遗传算法或者强化学习来做。非常耗时耗力。

第二步,有了结构后,还要从头开始训练这个深度学习系统,这样它才能应用到相应的工作中去。

有了深度学习系统的原始结构后,还可以将它变宽、变深、加速,让它的速度更快。

采用了Bayesian Optimization替代传统强化学习和遗传算法,让这一步变得比较快。

所有的学习都是基于上一步,所以第二步也能让速度非常快。他们可以把时间从原始的几天压缩到一个小时内。你给定一个数据,他们很快就能推荐相应的深度学习结构给你。

下图展示了他们一个月前发布的package,Auto-Keras

兴趣使然,看完了auto-keras的全部代码后,像我一样发现还是不够看的话…
下面是学界/业界在 auto-machine-learning 上的进展:

个人目前最喜欢auto-sklearn,在ML的框架上增加了 meta-learning 和 build-ensemble 两个有意思的模块变成 Auto-ML 框架:

也就是说,一般的分类或者回归的机器学习模型即将或者已经实现了低门槛或者零门槛免费的程度。
机器学习自动建模的难点还是在数据清洗和特征衍生这些技巧,至于模型的选择和超参数调参已经有比较成熟可用的代码了。
所以,已经有开源的代码的话,那些提供建模服务平台的公司为啥还能拉到那么多融资?

whatever, 我们的愿景是 人人都可以用得起机器学习系统🙂


[计算机视觉专场] ===========================

云、端、芯上的视觉计算 (孙剑,旷视科技首席科学家、研究院院长)

蛮喜欢孙剑的,可以种草一下:
【详细链接🔗】,推荐❤

ResNet part:

各种net大合照:


计算机视觉研究中的新探索 (林达华,商汤科技联合创始人,港中文-商汤联合实验室主任)

【详细链接🔗】,推荐❤

人脸识别的样本数据基于电影素材,挺有意思的,从而思考出人物之间的关系的信息对人脸识别的作用:

看图说话:

既然AI模型能生成一句话,那么是不是也能生成一段动作?下图展示了他们的一项最新研究,很多AI公司都在做这方面的研究,让AI生成一段生动的舞蹈。下面是一些简单的动作,这些动作都是计算机自动生成的,不是用程序描述出来的:


[IoT专场] ===========================

海尔的物联网 (赵峰,海尔家电产业集团副总裁、CTO)

智慧家庭

  • 4个应用物理空间:智慧客厅、智慧厨房、智慧浴室、智慧卧室
  • 7个解决方案:全屋用电、全屋用水、全屋洗护、全屋安防、全屋娱乐、全屋健康、全屋信息

食联网

  • 物联感知:图像识别、食材识别、温度传感、二维码
  • 人工智能:语音交互、食材管理、菜谱推荐、食品溯源
  • 生态服务:生鲜购物、新闻资讯、视频娱乐、健康管理

衣联网:

  • 衣联生态联盟
  • 衣联标准
  • APP显示
  • 洗衣机可识别各类衣服

U+ 智慧生活平台, 以 IoT+AI 赋能智慧家庭

  • 业务场景:厨房美食、起居场景、洗浴健康
  • U+ 智慧生活平台:UHomeOS (FULL/ Compact/ Lite) 数据,物联,生态,交互
  • 终端/用户:机机互联,用户社群

UHomeOS:

设备实时在线,全流程互联互通,实现故障自反馈诊断。(IoT+AI)

可定制交互,分布式、场景化的用户交互方式:

  • 智能音箱
  • 视觉投射
  • 腕投,掌上交互
  • 手机APP
  • 网器屏
  • 电视屏

其它会场的链接🔗


写在最后

  • 建立模型的第一步就是大量的样本数据,而目前就好像是采集数据的阶段,同时数据标注自动化这个功能也凸显的比较实用。
    很多公司都急着抢占市场,获取数据,将其私有化。的确获取数据有时是付出很大代价的,同时也是科研的第一步。但是其中一位演讲嘉宾提出一个有意思的观点:

    • 数据是人民币,不分享会贬值。新的data在源源不断的产生,不用/不分享的data会贬值。
      开源的代码早就不是新鲜事了,开源的数据也慢慢开始形成氛围,比如图像领域的ImageNet。
  • 关于算法存在的意义
    很多算法从你出生前就有了,但是只是从这两年开始火起来而已,还有很多很好用的算法没有火起来,风水轮流转的话,说不定哪天就…所以这就说到了(算法)存在的意义。没有单独的能打遍天下的算法,都是算法之间互相结合去面对实际困难的。同时不要沉迷在算法中不能自拔,要根据现实问题找方法,而不是根据方法找问题

  • 关于人工智能窃取隐私的说法
    很多人对于像推荐算法这类的应用有抗拒,比如Facebook之前被用户群起而攻之。
    我就很想站出来为这些优秀的算法说一句,每个人的id、姓名,这些信息对于算法来说是最最不重要的信息,都会在第一步被剔除。工程师只想知道样本有哪些特征,而特征,就是只是特征,而已。
    采集数据的时候,只知道有喜欢旅行的这样一个人,而不知道这个人是谁。
    不是因为你叫“范冰冰”而给你推荐化妆品的广告,而是因为你爱美,有化妆习惯,才会给你推化妆品的广告。如果是一只有购买能力,有化妆习惯,并且有手机,手机上还有社交app的老鼠,也会收到类似的广告的。
    种草是很花时间和精力的,我就很喜欢优秀的算法推荐出来的,就像知乎的高票回答,淘宝的猜你喜欢,虾米的每日30首。
    工程师不会打开所有样本用户的摄像头去看他们的隐私,变态才做这样的事。

  • 关于人工智能淘汰人类的说法
    很多培训机构为了卖课就向人们贩卖焦虑,说人类会因为科技而失业。张钹院士提到说,那些照章办事,不需要任何灵活性的工作才会如此。难道这不是好事吗?科技是在提高我们的生活质量。
    引用一位更直接的教授的话就是:会用人工智能的代替不会用的。
    其实很好理解,求生欲旺盛的人们早就会用智能产品,比如智能手机,2018年现在不会用手机的人必定引起生活的不便。求生欲爆炸旺盛的像我这样的人,就去学习人工智能。
    手机,从某个角度来说也是机器的一种,当手机出来的时候不知道是否引起很多人焦虑。
    AI is helping people, not replacing them.

  • 三天的行程就像是 a big picture of current AI.
    提高了一下人生广度😀,也顺便知道同行的伙伴都走到了什么地步~对隔行如隔山的产业成果也一饱眼福。
    提高广度后,至于深度,那是日积月累的事了。

PS. 门票很贵,死贵,是我霉演唱会的翻倍!所以鞠躬感谢绿米给我这个机会~

感谢阅读~ Have a happy day😎

打赏2块钱,帮我买杯咖啡,继续创作,谢谢大家!☕~
0%