大赛介绍

云计算、大数据的成熟催化了人工智能(AI)的进步与飞速发展,使得机器能够在很大程度上模拟人的功能,实现批量人性化和个性化的服务客户,这为深处服务价值链高端的金融业带来深刻影响,AI将成为银行与客户沟通中发现客户金融需求的重要因素。

百业之母的金融行业,呼叫中心作为对外交流的巨大窗口,语音数据体量巨大,是典型的非结构化“大数据”。海量录音数据中蕴藏丰富的客户、市场和服务增值信息,内含偏好选择、业务咨询等重要内容,是银行进行营销决策和产品服务设计的重要参考,在大数据时代,语音数据变为一种重要业务资产。

通过对大量通话记录和内容进行识别、统计、分析,可在最短时间内预测业务热点趋势,发现潜在客户,利用数据为业务全流程带来新的活力,最大化数据的商业价值。

本次大赛是面向全球金融行业AI技术精英的编程竞赛。通过开放真实的数据,结合金融行业热点课题,向算法天才征集更聪明的解决方案;并有机会直接将其应用于金融行业,建立新的商业模式。本次大赛由CSDN主办,IBM、兴业数金、NVIDIA鼎立协办,邀请来自企业与社区的多位人工智能专家亲临现场,提供现场指导与直播互动。大赛主题为“PowerAI 人工智能马拉松编程大赛——用客服语料挖掘潜在的产品销售商机和购买意向!”聚焦金融行业语料大数据,基于人工智能相关技术,计算有关金融场景的信息聚类,将电话银行海量通话内容结构化,并打上各类标签。通过挖掘分析有价值信息,为服务与营销提供数据与决策支持,发现最新的市场机遇和客户关注热点。

所有参赛团队,将现场免费体验IBM专门为人工智能所建的高性能计算服务器PowerAI。PoweAI人工智能平台基于Power8体系结构,支持开源机器学习和深度学习架构,包括CAFFE, Chainer, TensorFlow, Theano, Torch, cuDNN, NVIDIA DIGITS以及其它若干个机器学习与深度学习架构和库。参赛者将轻松便捷地使用这些人工智能方法,创建新的计算机模式以高效的对数据进行分析。

参赛时间:2017年6月17日   参赛地点:上海浦东杨高南路729号1号楼41F(陆家嘴世纪金融广场)

大赛直播

大赛直播 08:00-22:00

参赛流程

大赛启动

报名参赛

赛前培训

现场编程

评选及颁奖

参赛流程文字说明
  • 参赛者登陆活动页面,详细阅读大赛说明,并点击大赛报名,填写相关信息;

  • 活动组将安排赛前培训,报名者需随时关注赛前培训通知,准时参加;

  • 大赛当天进入赛场,现场编程,参与比赛;

  • 评审作品评选,当天公布评审结果并现场颁奖。

技术支持

题目说明

  • 大赛会提供训练样本数据。数据文件分为两部分,训练和测试部分。训练部分包括:

    a) 对话内容文件(文件格式可能存在转码需求,选手需要考虑)对话内容分为11类

    b) 对话内容标签文件,包括理财产品分类和意愿分类(肯定,否定,疑问)

    c) 语料文件-文件格式为txt格式。内容包括中文和标点符号。文章内容是金融相关的文章。文件总量在50M左右。参赛团队可以利用这些文件来建立自己的语言模型,分词模型等

    d) 训练数据:每个分类的样本个数不少于150条。数据样本间有一定区分度

  • 参赛者需要根据训练文件进行购买产品分类和意愿分类;

  • 大赛鼓励参赛选手自己构建分词和语言模型,如果选手选择使用第三方分词或者语言模型需要自己解决平台依赖;

评审规则

本活动由资深业务与技术专家,担任评委。具体规则如下:
实现对话内容分类(金融产品和意愿)功能(25分)
正确率评分标准 (Precision)(40分)
金融产品分类对测试Top1正确率:分为5档,档位为95%以上正确率20分,85%以上15分,80%以上10,70%以上5,其他0分;
客户意愿分类测试Top1正确率:分为5档,档位为95%以上正确率20分,85%以上15分,80%以上10,70%以上5,其他0分;
性能评分标准(25分)
取前5名,档位为第一名 25分, 第二名 20分, 第三名 15分,第四名 10分, 第五名 5分, 其他0分。
附加分(10分)
a) 选手根据大赛提供语料库训练分词系统并应用于后面的文本分类5分;
b) 选手使用深度学习框架生成词向量病应用于后面的文本分类5分;

奖品设置

注意事项

  • 通过Caffe、Tensorflow、Torch and Theano 进行模型训练, 鼓励发挥GPU on Power硬件特性;

  • 要求参赛者编写神经网络模型实现考题需求。参赛者可以修改Caffe,Torch, Theano或者Tensorflow源代码, 但是必须在修改后,提供代码修改说明以确定没有违规部分。参赛者也可以使用github上开源的不同发行版的Caffe,Torch,Theano或者Tensorflow, 但是必须自己解决在Power上的依赖和编译问题;

  • 本次比赛涉及金融领域对话文本分类问题。希望选手通过深度神经网络能够对客户感兴趣购买的保险或者理财产品的类型和意愿进行分类。语料中会有“肯定”,“疑问”,“否定或者双重否定”语句。传统的词频或者简单的SVD方式很难在测试数据集中有良好的表现;

  • 组委会统一准备PowerAI环境;

  • 作品提交内容包括:
    a) 设计说明: 设计的神经网络说明
    b) 修改代码说明(如果有)
    c) 设计的训练模型文件, 部署模型文件和训练好的权重文件
    d) 如果修改了代码或者使用了其他发行版, 需要提供完整的编译好的目标代码和源代码
    e) 测试数据集的输出结果文件.格式为Jason (任何形式的手动修改输出结果都视为违规)
    f) 测试数据集的总消耗时间日志文件(使用time 来运行test程序, 以real时间为准)

联系我们

联系人
Ms Chen

电话
15810810920

邮箱
chenmin@csdn.net