Tensorflow Embedding Projector 高维数据分析网页工具开源项目

我要开发同款
匿名用户2016年12月09日
49阅读
开发技术HTML/CSS
所属分类网页开发工具、Web应用开发
授权协议MIT

作品详情

EmbeddingProjector

EmbeddingProjector是一款用于交互式可视化和高维数据分析的网页工具,作为TensorFlow的一部分,能带来类似A.I.Experiment的效果。同时,谷歌也在projector.tensorflow.org放出了一个可以单独使用的版本,让用户无需安装和运行TensorFlow即可进行高维数据的可视化。

介绍

探索嵌入(embeddings)

训练机器学习系统所需的数据一开始的形式是计算机无法直接理解的。为了将这些我们人类能够自然而然理解的东西(如:话语、声音或视频)翻译成算法能够处理的形式,我们会使用到嵌入(embeddings)——一种获取了数据的不同方面(即:维度dimension)的数学向量表征。比如说,在一个语言嵌入中,相似的词会被映射到彼此相近的点。

降维的方法

EmbeddingProjector提供了三种常用的数据降维(datadimensionalityreduction)方法,这让我们可以更轻松地实现复杂数据的可视化,这三种方法分别是PCA、t-SNE和自定义线性投影(customlinearprojections):

PCA通常可以有效地探索嵌入的内在结构,揭示出数据中最具影响力的维度。

t-SNE可用于探索局部近邻值(localneighborhoods)和寻找聚类(cluster),可以让开发者确保一个嵌入保留了数据中的所有含义(比如在MNIST数据集中,可以看到同样的数字聚类在一起)。

自定义线性投影可以帮助发现数据集中有意义的「方向(direction)」,比如一个语言生成模型中一种正式的语调和随意的语调之间的区别——这让我们可以设计出更具适应性的机器学习系统

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论