新闻


灵魂画手已上线 请注意查收您的谷歌小工具“Quick draw”

日期:2019-02-12 浏览量:1768



这个小工具是谷歌人工智能项目的一部分,被称为“人工智能实验”。玩家画的画都会成为人工智能学习的资源,以增加未来它判断的准确程度。


灵魂画手上线!



Quick Draw数据集是345种类别中的5000万张图纸的集合,由游戏玩家Quick,Draw!提供。绘图被捕获为带时间戳的向量,标记有元数据,包括要求玩家绘制的内容以及玩家所在的国家/地区。您可以在quickdraw.withgoogle.com/data上浏览已识别的图纸。


原始主持数据集


原始数据以ndjson文件的形式分类,按类别分隔,格式如下:



每行包含一个图纸。以下是单个绘图的示例:



绘图数组的格式如下:



其中x和y是像素坐标,t是自第一个点以来的毫秒数。```和y是实数值,而t是整数。由于用于显示和输入的不同设备,原始图纸可以具有极大不同的边界框和点数。


简化的图形文件(.ndjson)


我们简化了向量,删除了时序信息,并将数据定位并缩放到256x256区域。数据以ndjson格式导出,其格式与原始格式相同。简化过程是:


  1. 将图形与左上角对齐,使其最小值为0。
  2. 均匀缩放图形,最大值为255。
  3. 以1像素间距重新采样所有笔划。
  4. 使用Ramer-Douglas-Peucker算法以epsilon值2.0简化所有笔划。


[examples / nodejs / simplified-parser.js](examples / nodejs / simplified-parser.js)中有一个示例,展示了如何在NodeJS中读取ndjson文件。此外,[examples / nodejs / ndjson.md](examples / nodejs / ndjson.md)文档详细介绍了一组命令行工具,可以帮助探索这些相当大的文件的子集。


二进制文件(.bin)


简化的图纸和元数据也以自定义二进制格式提供,以实现高效压缩和加载。



  • [examples / binary_file_parser.py](examples / binary_file_parser.py)中有一个示例,展示了如何在Python中加载二进制文件。
  • [examples / nodejs / binary-parser.js](examples / nodejs / binary-parser.js)中还有一个示例,展示了如何读取NodeJS中的二进制文件。



Numpy位图(.npy)


所有简化的图纸都以numpy.pypy格式渲染成28x28灰度位图。可以使用np.load()加载这些文件。这些图像是从简化数据生成的,但是与图形边界框的中心对齐,而不是左上角。


获取数据


该数据集在Google Cloud Storage上以ndjson文件的形式分类。请参阅Cloud Console中的文件列表,或阅读有关[访问公共数据集]的更多信息(https://cloud.google.com/storage) / docs / access-public-data)使用其他方法。


按类别分隔的完整数据集



  • 原始文件(.ndjson)
  • 简化的图纸文件(.ndjson)
  • 二进制文件(.bin)
  • Numpy位图文件(.npy)


Sketch-RNN QuickDraw数据集

该数据还用于训练Sketch-RNN模型。这个模型的开源TensorFlow实现可以在Magenta Project中找到,(链接到GitHub repo /树/主/品红/模型/ sketch_rnn))。您还可以在此Google研究博客文章中阅读有关此模型的更多信息。数据以适合输入到递归神经网络的格式存储在压缩的.npz文件中。

转自“SciTouTiao”微信公众号






推荐新闻

谷歌的事还没完,欧盟又要对苹果下手了2015-10-24

4月3日,欧盟反垄断机构欧盟委员会正在调查苹果跟唱片公司之间的协议。 据两位知情人士透露,欧盟委员会已经向几家唱片公司发送了调查问卷以了解关于他们跟苹果之间的协议的信息。其中一位知情人士说,欧盟委员会感兴趣的是这些公司跟苹果之前的协议和信函,还有它们跟其他音乐流媒体服务签订的协议。

火狐与谷歌默认搜索引擎协议或再续三年,费用高达13.5亿美元2020-08-26

据著名科技媒体ZDNet报道,火狐浏览器开发商Mozilla和谷歌的搜索引擎协议有望将再次延长三年的时间,新的协议将确保谷歌在2023年之前仍然是火狐浏览器的默认搜索引擎提供商,其年度使用费约在4亿至4.5亿美元之间。

谷歌开源基于 ML 的手部跟踪算法:手机端实时检测,多个手势同时捕捉2019-08-23

就在不久前,Google 人工智能实验室宣布,他们在「实时手部跟踪」方面取得了新的进展,并将这项新技术运用在了 MediaPipe 中,这也是 AI 计算机视觉任务的一大突破。这一技术不光可以在手机上实现实时捕捉性能,甚至可以同时对多个手的动作进行跟踪。目前,Google 已经将该项目开源,并且发布了相关博客介绍了这项技术,雷锋网 AI 开发者将其内容整理编译如下。

谷歌收购26英文字母域名2015-10-24

腾讯科技讯 10月8日,据外媒报道,谷歌(微博)新成立的母公司Alphabet Inc.近日买下一个包含所有英文字母的域名——abcdefghijklmnopqrstuvwxyz.com。

雅虎与谷歌签署搜索广告合作协议2015-10-24

根据雅虎周二向美国证券交易委员会(SEC)提交的8-K文件显示,该公司已同谷歌(微博)签署一份非独家协议,准许谷歌为雅虎的搜索结果提供广告。

谷歌宣布向黎巴嫩捐赠220万美元,以提供医疗救助等2020-08-20

谷歌宣布捐赠220万美元,以支持受最近首都爆炸惨案影响的贝鲁特人民。这些资金是作为员工捐款匹配计划的一部分筹集的。这些资金将捐给黎巴嫩当地提供医疗救助、公共住所和食品捐赠的非政府组织。