算法 [机器学习] Ruby China 招聘帖自动生成 API

AI_DEV · 2018年07月31日 · 最后由 love93hate 回复于 2018年08月27日 · 1397 次阅读

给Ruby China做了一个字符级端到端的招聘标题生成器,各位可以通过下面的在线生成API体验算法

真实的招聘帖标题

机器学习算法生成的招聘贴标题

  • [上海] 设计家招聘全栈工程师 [15-30k]
  • [北京] 紫光软件招聘 ruby 和 web 前端开发工程师
  • [北京] iClick 急聘 Ruby 开发工程师
  • [北京] D 轮融资互联网公司招聘 Ruby 工程师
  • [深圳] 招聘啦,求 Sketchup Ruby 二次开发的人才
  • [北京] 动吧体育招聘 ruby 工程师
  • [北京][东直门] 简单心理招聘 Ruby 工程师一名 (15 ~ 23k)

什么是字符级?

算法在生成标题时,是一个字符一个字符生成的,换句话说,算法并不知道Ruby是一个单词,所以如果算法生成了Ruby,它是依次生成R、u、b、y这四个字符的。

什么是端到端?

算法并没有使用任何规则,其实我们看到Ruby China的招聘信息有一定的规律,其实使用规则也可以生成,例如[地区]+公司名+招聘+职位+x名,这是传统的机器学习算法。端到端的算法不知道这些规则,在训练时只知道数据集中的标题字符串信息。

测试API

可以访问http://datahref.com/api/demo/job_title_generator来在线生成招聘帖标题

Todo

  • 计划在短期公开源码,目前代码还在改进
  • 不仅生成标题,还要生成头像、内容等
共收到 11 条回复

怎么实现的?贝叶斯么?

rubyfan1 回复

不是,说了是端到端的,也不是基于统计的

AI_DEV 回复

用Ruby写的么?

rubyfan1 回复

不是的,Ruby这方面生态还是有点弱

AI_DEV 回复

不是基于统计的??? 楼主能不能大概描述一下核心原理 ? thx

early 回复

大概是 LSTM with RNN 吧?

early 回复

同求原理

imwildcat 回复

LSTM,不过需要蛮多技巧

early 回复

用LSTM去预测下一个字(加一点随机),然后不断迭代。 例如给(起始符号)预测第一个字、然后用前1个字预测第2个字,用前2个字预测第三个字,每次都是用前面的序列来预测后一个字。

11楼 已删除

机器学习交易——如何使用回归预测股票价格?最近翻译了一篇文章,本人对机器学习应用在量化投资上很感兴趣,希望可以和社区大神一起交流学习。

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册