可视化历史:技术

项目层次 这是创建应用程序的主要问题之一。 由于时间轴是自动生成的,因此其中一个可能要加载数千个项目(例如,与“作家”或“女性”有关的项目),因此我需要为每个项目设置某种得分,因此我可能会将可视化限制为几百个最重要的可视化。 但这还不够, 层次结构必须针对每个上下文特定 。 如果说鲍比·菲舍尔(Bobby Fischer)在历史上最有权势的人物中不是太重要,那么在最伟大的棋手方面他绝对是顶尖的。 因此,每个可视化并没有真正显示项目本身,而是该项目与当前时间轴主题之间的关系。 这样,当您看到国际象棋棋手的时间表时,“棋手”和“鲍比·费舍尔”之间的关系得分很高,但是如果您看到“英语”语言的时间表,甚至认为那是他的母亲舌头,分数要低得多,因为您可能会看到国家,机构和作家之类的东西。 简而言之,每个项目的得分是根据以下各项的组合来计算的:项目的关系量,与该时间轴相关的与该项目的共享关系量,Wikipedia上的反向链接量以及Wikipedia的长度文章。 最后,电影的评论评分也会影响电影的评分(在IMDB,烂番茄,电影相似性和Metacritic等网站中),并且所有内容都会随着年龄的增长而增加,因为您不会期望看到某人或城市时会看到他们跨度数百万年。 该技术远非完美,但已被证明足以作为起点。 此后,可以在界面中调整项目和关系的得分,此功能很快将对所有人开放。 可视化 当然,这是项目的核心。 可能有很多要谈论的话题,但是我会让你自己寻找。 快速说明一下,我在开发的早期就决定不使用第三方库,甚至以为我喜欢D3.js之类的工具,当时的想法是使用纯html…

“唐纳德·特朗普”的许多相关概念

我们在Kaleida所做的部分工作是从大量来源中搜集大量新闻文章(有关更多信息,请参见前面的帖子),并尝试弄清哪些与其他文章保持一致,哪些与他人无关。 当足够多的相似文章捆绑在一起时,它们便成为主题。 反过来,主题可以改变并缓慢转移焦点,直到它们达到断点并分裂为新的主题(在显微镜下将细菌细胞的蒙太奇分解并繁殖)。 反过来,这些缓慢(有时快速)变化的主题构成了叙事的主干,或者用新闻术语来说是“持续的发展中的故事”。 主题的核心组成部分之一是“概念”。 这是一个有点笨拙的术语,它是一种精确但实用的术语,由软件工程师在试图使计算机将一段书面散文简化为足以使算法紧缩的东西时使用。 简而言之,本书将撰写一篇关于气候变化的精心撰写且经过深思熟虑的1,600字的文章,然后说:“哦,这很明显; 树木,冰帽,伦敦,住房市场,污染,二氧化碳,农业补贴和badge ”。 是否还找到有关树木,污染,农作物,农业补贴和badge的另一篇文章? 好了,您便有了“集群”的开始,这是另一个功利性工程术语。 两篇概念完全不同的文章? 然后我想它们是无关的。 你说番茄我说番茄 关于概念(以及相关主题领域)的另一个有用的部分是,它为我们提供了一种通用语言(英语以及随之而来的所有偏见),以连接来自许多不同来源的文章。 例如,《卫报》没有一般性的“汽车”版块,但仍然报道有关汽车的新闻,通过让计算机将信息分类为概念和版块,我们可以在出版物之间进行标准化。 “英国,2016年英国欧洲联盟成员公投”,又名英国脱欧。 在源文本的特定语料库上训练算法以将冗长的语言分解为活泼的概念的一个奇怪的怪癖是发生的歧义消除,将语,缩写和昵称转换为更正确的技术术语。…

注释图的三种方法

《纽约时报》 Upshot的编辑阿曼达·考克斯(Amanda Cox)曾经说过:“注释层是我们要做的最重要的事情……否则,就来了,您要弄清楚。” 以我的经验,为图表添加注释是很多人没有考虑的事情之一,但这对于帮助读者更好地理解上下文和论点可能是至关重要的一步。 简单地帮助您的读者了解如何阅读图表也很重要。 在我看来,我们可以在数据可视化中包括三种类型的注释,从简单到更复杂:添加标签,创建活动标题和添加细节。 1.添加标签 让我们从最简单的注释类型开始:添加标签。 许多软件工具中的默认设置是创建一个数据图例,并将其放置在图表下方或侧面某处,与数据断开连接。 这迫使您的读者做更多的工作来弄清楚每条线或条代表什么。 相反,更好的方法是直接标记您的数据系列。 这使您的读者更容易将数据值与其描述相连接。 请看我在“残疾保险”计划中写的一篇论文中的折线图。 我在图表中包括了所有50个州以及华盛顿特区,并突出显示了七个感兴趣的州。 我没有在图的顶部添加图例,而是在右侧标记了这些线,并对其进行了颜色编码以匹配这些线。 这不必复杂或困难; 它只需要考虑读者的观点。 请记住,您的听众可能并不熟悉内容或数据,或者只是对数据的表示不熟悉,因此我们希望使他们尽可能容易地吸收内容。…

提示和技巧:VictoryChart

虽然有很多数据可视化软件包都可以很好地与JavaScript一起使用,但是当我想将其集成到我的React项目中时,我发现其中一些很棒的选择对于使用React并不是最佳选择。 例如,有一个用于React的D3库,但是自从上一次React更新以来,它没有被更新。 诸如Chart.js之类的其他选项也很棒,但是我发现我想要的数据显示库不仅具有出色的文档,而且引起了人们的关注。 就是说,我的意思是说我希望图表从一开始就看起来不错,而无需我决定数据点的大小或图表线的粗细。 虽然我最终想修改这些东西,但我对一个看起来不错并且可以简单工作的库非常感兴趣。 这些必要性使我探索了许多不同的数据可视化库。 我最终登陆了VictoryChart,该库的创建是为了允许用户快速轻松地将数据可视化合并到他们的项目中。 VictoryChart拥有我需要的所有图表类型(散点图,条形图,饼图),并且它们的所有图表看起来都非常容易上手。 此外,入门文档非常清晰,使该库看起来简单易用。 虽然这是事实,但我发现有些东西并不明显,也没有包含在文档中。 我创建了5个技巧来使您的VictoryChart项目顺利进行! 散点图气泡大小 VictoryChart散点图非常出色,因为它们提供了“气泡”的动态大小调整,这意味着在给定特定范围的情况下,图表将自动调整气泡的大小以适合该范围。 这对我的数据可视化非常有用,因为我拥有从低千到几百万的大量数字。 气泡大小允许在不显示高点和低点之间的大小差异太大的情况下显示数据差异。 为了合并气泡大小,我发现这实际上非常容易实现,只需要我设置最小大小和最大大小(1–25),并告诉气泡要寻找哪个值即可。 在我的数据创建方法中,我创建了一个键值对,键对为’amount’,且值为我想要的大小。 我在VictoryScatter组件中做到了这一点:…