8日是技术的盛宴,9日是技术+应用的狂欢。
11 月 9 日,中国专业 IT 社区 CSDN 与硅谷 AI 社区 AICamp 联合出品的 2018 中国 AI 开发者大会(AI NEXTCon) 迎来了机器学习、知识图谱和语音技术 3 大技术专题,以及智慧金融、智能驾驶和智慧医疗 3 大行业峰会。
只讲技术,拒绝空谈,下面我们就来一起回顾下技术大牛们在今天做的精彩分享。
机器学习技术专题
第四范式联合创始人、首席架构师 胡时伟(出品人)
胡时伟的演讲主题为《“零”门槛开发高维机器学习应用》,除了技术分享,他还表示,希望让业务部门的负责人和所有决策者知道,AI 到底是什么,不要一讲 AI 就说知识图谱是 AI,深度学习是 AI。在他看来,AI 要让机器对数据进行学习,从而让机器能够对某一个具体的目标具有判断能力,这样的人工智能才真正可以帮助企业。
字节跳动人工智能实验室总监 李磊
李磊的分享主题是 Learning to Generate Better News, Translation, and Advertisement。字节跳动一直在研究如何利用算法做更好的内容创作,包括用算法让机器自动写新闻,用算法帮助作者写好文章,用算法自动生成标题或者摘要,以及让算法设计更好的广告文案或者生成用户的评论。在演讲中,李磊介绍了字节跳动研发的自动写作机器人——小明机器人,并详细介绍了背后的文本表示和生成方面的技术。
普元移动产品线总经理 郝振明
郝振明的演讲主题是《机器学习在 RPA 中的实践与探索》。在演讲中,郝振明介绍了普元如何把机器学习与 RPA(Robotics Process Automation)结合,解决公司财务都会遇到的代理申报问题。
松鼠AI智适应教育首席科学家 崔炜
崔炜的分享主题是《松鼠 AI 智适应技术的实践与落地》。崔炜表示,松鼠 AI 的目标是要打造智能个性化学习平台。基于目标特征,他们为这个学习系统开发了四套模型:学生模型、内容模型、教学模型、预测模型,这四个模型相互结合,才能打造更加个性化的学习产品。
OneClick.ai CEO 沈渊
沈渊的演讲主题是《自动化深度学习开创人工智能的未来》。沈渊提到,现在业界学术界处理 AutoML 的问题一般用的都是神经网络搜索,但是 OneClick.ai 的全自动化深度学习平台不太一样,他们会把传统的机器学习和深度学习放在一起优化,特征工程和模型可以同步优化,避免像以前一样每个节奏都是相对独立的,因此训练速度很快。
微博机器学习研发部基础算法负责人、高级架构师 刘博
刘博的演讲主题是《机器学习在微博信息流推荐的应用实践》。在演讲中,刘博提到大规模推荐系统作为新浪微博信息流推荐的核心,在排序环节中主要基于用户特征、内容特征、环境特征、上下文特征等进行 CTR 用户排序,构建模型时将博文列表作为样本数据,通过预估每条微博 CTR 概率的大小来判断。
阿里巴巴资深技术专家 杨旭
杨旭的分享主题是《Alink 流式算法平台架构与实现》。杨旭介绍,基于 Flink 框架构建流式算法平台,可直接从算法级组件入手。Alink 的核心是丰富的数据分析算法库,包括机器学习、推荐等,尤其是推荐训练,如今将批式训练和流式预测放在同一平台上,用户可以轻松完成端到端的系统建立。
知乎首页业务总监、首页推荐技术负责人 张瑞
张瑞的演讲主题是《知乎首页信息流系统的框架及机器学习技术在推荐策略中的应用》。在演讲中,张瑞提出一个问题:内容推荐的精确度能否代表所有需求?为此,知乎引入各种框架进行业务导向调权、打散、隔离和禁闭。如果用行为表现预估排序推荐,最后会形成“信息茧房”,针对不同用户探测,应尽量使用内容间的关联信息增强探测效果。
小米闲聊算法负责人 崔志
崔志的分享主题是《机器学习技术在 “小爱同学”闲聊算法中的应用》。崔志表示,要想让机器人更像人类的朋友,需要做到的非常重要的一点就是情感计算。使用分类模型对情感进行识别,再通过 MLP 得到 Happy、Sad、Anger 等回复,其中自动情感生成需套用 Encoder 和 Decoder,这样就可以生成一个有情绪的回复。
百度核心搜索部资深研发工程师 曹皓
曹皓的演讲主题是《机器学习在搜索领域的实践》。在演讲中,曹皓介绍了百度搜索未来要探索的三个方向:第一是智能标注,通过机器学习的手段提升标注的效率和准确率;第二是内容检索,从网页图文检索转化成视频等内容检索;第三是 GPU 和目前比较火的 IPLV 等技术。
智慧金融行业峰会
天云大数据数据科学家 吕慧
吕慧做了题为《AutoFE 和 AutoML 从免编程建模到 AI 零知识启动》的主题分享,她介绍了如何快速构建传统领域的金融机器学习平台,并表示 AI 生态需要“Android”,在不远的未来,AI 应用将不再是少数大公司和精英科学家的专利,AI 将逐渐应用到各行各业,AI 行业需要自己的“Android”实现这一转变!
亿喆 ECB 创始人 & CEO 金龙
金龙分享的主题为《AI+Blockchain 助力普惠金融》,普惠金融市场空间大约在 20 万亿,个人信用记录不完善,缺少相关金融经验,单笔贷款资金需求量偏小、群体基数大,这些都是普惠金融客户的主要特征。普惠金融如何平衡“商业回报”与“社会价值”,实现“普”与“惠”的双重目标都是最大的难点。而通过区块链的数据完整性、系统可用性、数据安全性,构建可编程金融基础设施,可助力普惠金融。
小花猪分期 CEO、网信前 CTO 周欣
小花猪分期 CEO、网信前 CTO 周欣发表《金融大数据平台的实践及创新应用》主题演讲,周欣从智能 BI 报表系统、智能风控、不需要开发的后台和业务及全链路实时数据监控四个实践来介绍金融大数据的平台搭建。最后对大数据实践下的金融科技进行展望:AI 机器人可替代理财经纪人;物联网金融大数据增强风控措施;深度学习助力智能股票交易策略;基于大数据的生物识别增强风控;合作培养人才打造高性能实时计算引擎和集群;基于 AI 大数据的股权投资模型。
宜信大数据创新中心首席量化科学家 杨博理
宜信大数据创新中心首席量化科学家杨博理分享了《AI 在财富管理上的应用趋势与实践》的演讲。他表示,用机器学习算法预测资产的未来价格和收益的有效方法是存在的,但在基金层面的实践经验上,投入产出比不高。对于财富管理,尤其是大类资产配置业务而言,存在与收益同等重要的其他特征,也需要加以预测,这些特征也许更值得尝试用机器学习的方法进行预测。AI 在财富管理流程中的预测和理解层面上都可以发挥作用,目前金融逻辑仍然在整个流程中占主导地位,实践中需要对哪些方面适合使用 AI 技术有清楚认识。
智能驾驶行业峰会
驭势科技视觉感知技术负责人 潘争
盘整的演讲主题为《智能驾驶视觉感知的挑战与应对》自动驾驶在视觉感知领域的挑战主要包括三点:高精准、多功能性以及实时性。也就是说,这需要对每个可行驶区域进行高精准且多功能性感知,如果感知算法足够快,才能保证识别实时性,这需要通过数据、模型、算法、安全等方面解决。
Neurala 高级研究员 Jeff Rondy
Jeff Rondy 的分享主题为 Data Collection and Annotation Using Neurala Brain Builder。Brain Builder 是 Neurala 开发的一站式 AI 平台。借助 Brain Builder,企业和开发人员能够轻松完成从标记训练数据集到使用数据开发人工智能应用的各项工作。
地平线智能驾驶研发总监 余轶南
余轶南的演讲主题是《基于自由计算平台的自动驾驶研发实践》。余轶南表示,地平线比较关注前端边缘计算的 AI 平台,这种平台对芯片的要求集中在高性能、低功耗、低成本、便携式等方面。针对目前火热的自动驾驶领域,芯片的算力与算法的使用更多是为了让车辆在行使过程中更安全、高效。
DeepMap 工程技术总监 邹亮
邹亮的分享主题是《深度学习在无人驾驶高精地图生产中的挑战与应用》。在演讲中,邹亮介绍了目前 3D 点云检测存在的两方面的挑战:首先是高质量的训练集比较难获取,往往需要内部训练集,而且时间久价格高;另一方面精准率不如 2D 图像深度学习的结果准确。
智慧医疗行业峰会
大数医达创始人 & CEO、复星集团人工智能首席科学家 邓侃
大数医达创始人 CEO、复星集团人工智能首席科学家邓侃分享的主题是《小样本学习在医疗领域的技术实践》。 人工智能所面临的一大问题就是数据,深度学习极高的数据标注需求更是每遭诟病,小样本问题愈加突出。他们将小样本学习引入医疗领域,开创临床决策深度学习,其中包含医疗私有云、病历结构化、医学知识图谱以及临床决策导航四项技术基础。
中科院计算所副研究员 赵地
赵地的演讲主题为《深度学习与医学影像分析》。电子病历是医院数据中最基础的部分,而论及数据量,又以医学影像规模最大,于是他们将深度学习引入医疗领域,其应用涵盖疾病预测、基因分析、行为分析,及影像分析等,未来还将向深度学习与医学影像分析的医疗设备和机器人的研究方向继续探索。
Airdoc 创始人 & CEO 张大磊
张大磊的分享主题为《人工智能与临床决策》。张大磊表示,从现阶段的实际情况来看,谈“人工智能取代医生论”还为时尚早,目前还停留在协助医生决策的初级发展阶段,完全替代还有很长的路要走。长期以来,中国在医疗领域的漏诊和误诊普遍存在,而算法的引入能够在一定程度上缓解这一问题。
丁香园副总裁 张伟
丁香园副总裁张伟本次分享的主题是《皮肤病人工智能发展实践分享》。他表示,对于医疗,应该常怀敬畏,深刻理解每一种疾病的临床与诊疗特性,明确人工智能的引入方向。皮肤病便因其病种繁多、诊断困难及患者疾病认知程度局限等问题,急需人工智能助手的协助,以达到辅助医生、辅助患者以及辅助基层的目的。
知识图谱技术专题
东南大学教授、博士生导师 漆桂林(出品人)
漆桂林的分享主题是《知识图谱的表示与推理》。在演讲中,他介绍了知识图谱的表示方法,以及两类基本的推理方法:记忆逻辑和记忆途径。漆桂林表示,知识图谱要有一定的逻辑基础,并且有一个网络结构,以及知识变形,否则无法做到高效和实用化。
百度知识图谱算法团队负责人 张扬
张扬的演讲主题是《大规模通用知识图谱构建及应用》,他首先介绍了知识图谱在百度的应用,并从构建和应用的角度介绍了百度近期在知识图谱领域的一些工作。此外,张扬还详细介绍了构建知识图谱的四大技术:事实获取、Ontology构建、实体归一、主动收录。
阿里业务平台商品知识图谱负责人 张伟
张伟的演讲主题是《电商领域知识图谱的构建与应用》。围绕知识生命周期,张伟结合阿里自身业务提出了四大挑战:如何快速搭建各个领域的知识图谱;如何把各个领域的知识图谱快速联通;如何管理海量的知识(事实类知识和形式化知识);如何更新这庞大的知识图谱;如何面向搜索推荐、智能交互、商业能力智能化等多种应用做统一的知识表示。此外,张伟也介绍了阿里的知识引擎架构与藏经阁计划。
云知声资深技术专家、AI Labs 技术总监 刘升平
刘升平的分享主题是《医学知识图谱的敏捷构建与实践》。刘升平指出,在构建知识图谱时,一定要看行业历史上的知识表现方法,通过借鉴这些方法来降低成本。另外一定要应用驱动,而且一定要选好知识图谱的评测方法。
美团点评 NLP 中心知识图谱算法负责人 张富峥
张富峥的演讲主题是《餐饮娱乐领域知识图谱的构建与应用》。张富峥介绍了美团大脑在美团搜索推荐场景的应用,他们把搜索推荐的场景拆分成不同层次:索引层、数据层、召回层、排序、策略融合、用户感知优化层,而且在各个不同层次都会进行辅助,把它整合成一个知识,作为数据存储进来。在召回层通过实体链接技术,找到用户的兴趣点和意图,对 query 进行查询纠错、语义理解,让机器了解用户的真实需求。
语音技术专题
声智科技创始人 & CEO 陈孝良
陈孝良的演讲主题是《远场语音交互技术与实践》。他认为,新的传感是新的机会,新的交互是新的革命,新的互联是新的时代。远场语音交互就是从“学习机器”到“机器学习”的技术革命。
清华大学语音和语言技术中心主任、得意音通董事长 郑方
郑方的分享主题是《声纹识别技术及其应用现状》。郑方表示,语音技术发展到现在有很多突破,但却没有在真正在应用上得到使用,原因在于很多场景没有选好。声纹确认核心需要解决的是身份认证的问题,这在技术上有五项要求分别是:人证合一、不易伪造、意图真实、证据可溯、认证便宜。
云知声董事长、CTO 梁家恩
梁家恩的分享主题是《AIoT 智能交互技术与应用》。他表示,智能 AI 行业应用的高效定制、调优和数据闭环,需要合理的 AI 架构支撑,提高扩展性和演进效率。超算平台和 AI 芯片,是智能交互迭代演进和产品落地的关键支撑。
标贝科技联合创始人、CTO 李秀林
李秀林的演讲主题是《语音超市实践--助力智能产品人性化》。在演讲中,李秀林指出了语音合成技术的实践现状:一是端到端很美,控制很难;二是语音数据少,文本很多;三是 GPU 很贵,CPU 为主。语音合成仍是一个方兴未艾的状态。
出门问问 CTO 雷欣
雷欣的分享主题是《语音交互的软硬结合》。雷欣表示,想要做好软硬结合的智能语音交互产品,绝对不是只专注于某一项技术,而是讲求端到端,即时间延迟的速度是否够快,结果又是否足够令人满意。
高能预告
虽然 2018 年开发者大会已经落下帷幕,但是我们还是为意犹未尽的观众准备了一份大礼:《2018 中国人工智能产业路线图 V2.0》正式版。
在昨天的大会上,CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛已经预先披露了这本报告的精彩内容,很多观众都对这份报告有着浓厚的兴趣。
实际上,相比去年的 V1.0 版发布以来,此次 V2.0 版路线图将进行新一轮大升级,内容包括 3 大 AI 前沿产业趋势分析,10 多位 AI 特邀专家的深度技术分析,10 多家一线互联网企业的 AI 实力大巡展,以及多个 AI 优秀应用案例,力求为读者呈现更全面的中国人工智能产业发展概况和趋势判断。
目前,这份报告已经送予 AI 开发者大会的与会专家,在根据专家的点评校订之后,我们将会推出正式版。大家可以关注我们公众号,我们会在一周左右时间内发布完整报告。
精彩现场
最后,在此感谢支持本次大会的所有专家与观众,以及我们的合作伙伴和工作人员。
#号外#2018中国大数据技术大会将于12 月 6 -8 日在京举行,第一批“早鸟票”报名通道已开启(点击阅读原文),期待与您一起,共论大数据创新应用!更多信息请关注官网: