漫长而曲折的道路

在今年的GCSE结果日前夕,即将离任的国立学校专员David Carter先生发了以下推文: “学校改善不是直线的旅程。 成果可能需要一些时间才能赶上正确的策略来做得更好。 如果您做正确的事,今天带给我们的一切,那就继续前进” 这种观点显然引起了很多人的共鸣,因为在撰写此博客时已被转发316次,并被758次喜欢。 对于尚未走上这一旅程的学校来说,好消息是戴维爵士显然正在采取某些行动…… 让我们看一看2017年中学排名前20%的情况,然后看看在过去五年中他们的排名*。 我们可以看到,虽然44%的人已经在2013年排名前20%,但其他56%的人不在。 实际上,其中有20%的客户在5年前就处于最低的50%。 但是,虽然这张图表可能给人以印象,这些学校随着时间的推移都在平稳地改善,但实际上,许多学校的进步之路非常艰巨。 以下是学校经历的跌宕起伏的细分,从2014年的最低50%到2017年的前20%(即,目前排名前20%的学校中约15%)。 该图表显示,在这三年中最终从最低50%升至最高20%的学校中,有11%实际上在第一年倒退了,后来又有所改善。 第一年又提高了14%,但第二年又有所下降,最终又有所改善。 如果将其中24%的在第一年或第二年中表现平平的学校包括在内,则您将获得49%在此期间的前两年中经历了衰退或停滞的学校。 最后,将28%的学校在两年内急剧改善但在第三年保持不变或下降的因素考虑在内,那么剩下的23%的学校在这三年中都有显着改善。 确实是非线性旅程…… 但是原本排名前20%的学校又如何呢?…

互动可以做什么(文章不能做)

这是互动的艰难时期。 去年围绕格式是否已失效(是否已失效)展开了辩论,很难不注意到整个行业的趋势,即从使用实时代码的交互式图形转向静态图像和ai2html。 这样做有很多充分的理由:更好地了解读者的行为,从混乱的非结构化和非线性结构转变为线性结构,移动设备施加的设计限制,用于重新分发文章的第三方平台(例如Google AMP或Facebook Instant Articles) -不支持自定义脚本和复杂的内容,并且(也许最重要的是)承认出于交互目的进行交互是不值得的。 这种巨变可能令人沮丧。 我作为Web开发人员和报告人员的混合体进入了图形世界,因此看到“ Web开发人员”一面变得不那么重要有时会让我感到自己像是一个遗物,好像我一直在使用一种过时的格式和越来越少的相关技能。 因此,为了消除这种感觉,以下是交互式图形(或使用我的首选术语,Web图形,因为其中一些并不严格涉及交互性)可以做的事情,而传统文章或静态图片则做不到。 我整理了这份清单,改编自2015年我的演讲,以此作为我自己作品的灵感来源,我希望它也能激发您的灵感。 探索庞大的数据集 交互性的一种经典用法是为读者提供庞大的数据集,并允许他们“潜入”并根据自己的喜好进行深度探索。 有时这会变成一张巨大的桌子(下图)。 其他时间,一张大型互动地图。 如今,这种格式经常被人们忽视,因为它希望读者自己找到有趣的部分。 但是如果数据足够多,它仍然可能很有价值。…

国情咨文分析

国情咨文,或美国总统在国会发表的同等初稿,很可能会提供有关该特定总统希望将美国带往何处的想法。 通过分析所有发表过演讲的候选人的演讲(有几位在获得机会之前死亡),我们应该能够看到在225年中哪些总统的思想过程和政治信仰相似。 我们还应该能够检测到这些演讲的方式以及每个演讲的核心是哪些主题方面的重大变化。 为此,我向国会主席致了第一份演讲,并结合了文本提取,文本处理和数据可视化方法进行了分析。 让我们看看这个过程揭示了各个政治人物以及过去两个多世纪以来可能发生的任何较大变化。 我们对这些演讲中的文本模式进行分析的首次尝试是由各种出色的工具提供的:Aylien用于实体提取,Exploratory用于其他文本操作,Gephi用于网络图创建和探索,最后是sigma.js用于创建一系列交互式工具。网络显示。 我们为该项目提供的源数据来自美国总统职位项目,该网站专门收集和共享所有美国总统的论文和演讲。 这为我们提供了许多丰富的资料可供分析,包括国情咨文或每位总统向国会发表的类似演讲。 我认为比较和对比总统任职期间的最初讲话将是很有趣的,尽管看到每个总统任期的年度讲话中的变化无疑会令人着迷。 第一步是使用Aylien强大的实体提取工具,该工具将使用指定的类别(例如关键字,位置,组织等)读取指定位置的网页,分析文本并以JSON格式返回结果。 。 为了该项目的目的,我选择了上述关键字,位置和组织类别。 然后,从这个基础上,我们可以将数据推送到单个Excel(或类似文件)中,在该文件中可以开始其他处理。 如果我们希望使用网络图分析来分析该数据集,则有两个需求。 首先,我们将需要一个节点文件,其次,还需要一个边缘文件,用于定义节点之间的连接。 现在回想一下前面提到的Aylien提取的类别; 这些类别及其成员文本术语将构成我们节点的大部分。 但是,我还有另外一组要提及的节点-单独的演讲者发表了我们准备分析的数十种演讲中的每一个。…

幸存者联盟网络可视化

现在我们已经定义了联盟索引来量化被抛弃者之间的关系,接下来我们该怎么做? 我们可以通过以遇难者为节点,以一对遇难者之间的联盟索引为边缘,来建立幸存者联盟网络。 然后,可以将Survivor联盟网络用作每个季节关系的直观摘要。 在本文中,我将演示如何构建联盟网络,然后展示它们的外观。 使用NetworkX建立幸存者联盟网络 考虑一个幸存者的单个季节。 通过将被抛弃者视为节点集,并将每对被抛弃者之间的联盟指数视为边缘集,可以提取出本赛季以外的网络。 请注意,我们对联盟指数的解释是关系强度,因此生成的网络不仅是普通的,未加权的网络,而且是具有联盟指数给定的关系强度的加权网络。 稍后,我们将可视化强度与边缘厚度的关系。 我们可以使用Python中的NetworkX模块以一种非常简单的方式来构建网络。 为了在NetworkX中定义网络,我们使用nx.Graph()构造一个网络对象。 让我们将结果网络称为G。要向G添加节点,我们执行G.add_nodes_from(node_list),其中node_list自然是节点列表。 要向G添加一条边,我们执行G.add_edge(edge_pair),其中edge_pair是我们要连接的一对节点。 然后,我们定义一个函数plot_network(),将季节名称作为输入并将关系网络输出为png文件。 此功能分别依赖于Scraping the Survivor Wiki和Survivor…