KDD18 伦敦: 使用Apache MXNet Gluon进行深度学习和自然语言处理

时间: 星期二,2018年8月21日
地点: ICC Capital Suite Room 14+15+16

主讲: Alex Smola, Leonard Lausen, Haibin Lin
更新于2018年8月16日

English

摘要

如今炼丹事业如火如荼,丹方越来越复杂,丹也越炼越大颗,越发挑战丹炉的极限:能不能多GPU?能不能云端多机?尤其是自然语言处理的丹方特别复杂: 字符级编码器、预训练词向量、长-短期记忆单元、用于解码序列输出的集束搜索等等,极大提升了我们炼丹的难度。

MXNet 团队将在 KDD18 伦敦用一整天来演示集 MXNet 比曹操都快的速度和如丝般顺滑易用的 Gluon 前端于一体的全新 GluonNLP 工具包(GitHub)。GluonNLP 工具包抓准自然语言处理从业者诸多痛点,相信我们提供的自动化工具能为您的任务添砖加瓦。在演示中我们将从Gluon入手,涵盖数据、自动求导、以及深度卷积和递归神经网络。之后我们将深入介绍主角 GluonNLP,演示如何使用预训练词向量、如何自己训练词向量、语言模型以及知名的用于机器翻译的 Transformer 模型。相信看了我们的演示,您也只需要三分钟,就会爱上 GluonNLP 啦!

AWS Icon   AmazonAI Icon   Apache Incubator Icon   MXNet Icon   Gluon Icon

准备工作

虽然这次我们准备的 notebook 大都可以直接用大家自带的本本跑,有一些 notebook 使用 GPU 跑会更好。活动当天我们会为每位参加者提供一个价值$50的 AWS 兑换码,以供各位在 Amazon EC2 上动手练习。

参加活动前,请大家记得确保自己的 AWS 账号里在 EU (Ireland) 有至少一台 p2.8xlarge 以及一台 p3.2xlarge 机器的上限。你可以在注册 AWS 账号后根据这个页面的说明查询和申请 EU (Ireland) 区域的 p2.8xlarge 以及 p3.2xlarge 机器的上限

课程材料在KDD18-Gluon repo.

邮件申请加入Slack上的#gluon-nlp频道。

更新: 欢迎直接使用注册链接加入我们的Slack站点。

Agenda

Time Title Slides Notebooks
8:30-9:15 Installation and Basics (NDArray, AutoGrad, Libraries) link link link
9:15-9:30 Neural Networks 101 (MLP, ConvNet, LSTM, Loss, SGD) - Part I link link
9:30-10:00 Coffee Break
10:00-10:30 Neural Networks 101 (MLP, ConvNet, LSTM, Loss, SGD) - Part II link
10:30-11:00 Computer Vision 101 (GluonCV) link link
11:00-11:30 Parallel and Distributed Training link link
11:30-12:00 Data I/O in NLP (and Iterators) link
12:00-13:30 Lunch Break
13:30-14:15 Embeddings link link
14:15-15:00 Language Models (LM) link link
15:00-15:30 Sequence Generation from LM link link
15:30-16:00 Coffee Break
16:00-16:15 Sentiment Analysis link
16:15-17:00 Transformer Models and Machine Translation link link
17:00-17:30 Questions

联系我们 amazonai-kdd18@amazon.com