BOSC 2017第2天,第2部分#BOSC2017 #ISMBECCB

这是故事的一部分,在这里我总结了最后的BOSC闪电谈话,开放数据面板和FAIR宾果游戏。 在阅读本节之前 您可能希望阅读有关 BOSC 第1天 第2部分第1 部分的信息!

工具狗

在上一篇博文中,我在最近的闪电演讲中进行了部分讨论。 回过头来,我们被Kenzo-Hugo Hillion简短地谈论了ToolDog。 ToolDog为Elixir的生物信息学工具注册表中的工具提供了通用的描述性包装器。 您可以在F1000上看到有关它的海报。

BioThings SDK

Wu Chunlei Wu在大会上进行了第二次BioThings演讲,重点是SDK,它为您提供了创建自己的BioThings API的工具。

站在巨人的肩膀上与超级细菌作战

凯·布林(Kai Blin)谈到了抗生素的可怕前景,它可能会在不久的将来完全停止工作-众所周知,抗生素经常被过度使用和滥用。 随后,他给了我们一线希望和鼓舞:我们正在努力寻找新的方法来对抗感染。 通常,这些是计算上的努力。

科学绝大多数使用什么软件栈? 它是开源的。 我们可能在这里只提供一行代码,在那儿提供拉取请求,甚至可能维护一个更大的程序包-但是如果没有开源软件的工作,未来可能会比以前更加黯淡。 开源三声欢呼!

我为午餐时间参加哪一次BoF(“羽毛之鸟”)而感到震惊。 一方面,有一个JOSS BoF,并且当天早些时候的JOSS演讲真的很有趣。 另一方面,eLife BoF听起来也非常有趣!

我抛开了脑筋,来到了eLife,Naomi Penfold进行了一次有针对性的会议,讨论了适当处理科学代码的方法,因为传统的发表论文模型可能会导致数据丢失和混淆,而代码无法重新使用。 -运行且检查不充分的代码,可能根本没有经过任何同行审查。

关于如何解决该问题以及期刊上有多少责任的讨论使我着迷。 最初,我认为严格限制软件质量和可重复性的期刊才是明智的,这是创建有效科学的必要步骤,但很快我就清楚地发现,我的观点有些天真-如果期刊太费力而无法提交论文给许多人人们只会去阅读不太严格的日记,因为质量较低的条会更容易通过。 Naomi在etherpad上实时获取了讨论摘要。

Brassica Information Portal是Annemarie Eckes向我们介绍的。 芸苔包括白菜,芥末,西兰花和油菜籽/低芥酸菜籽,以及其他美味食品。 该门户同时包含GUI和API,允许研究人员根据需要以编程或图形方式访问和更新数据。

这次小组讨论吸引了来自BOSC的几位发言人:Madeleine Ball,他在第一天作了Open Human主题演讲; Carole Goble,他在当天早些时候介绍了Bioschemas; Nick Loman,在主题演讲后作了主题演讲; Andrew Su ,他讨论了WikiData和CC0许可。 MónicaMuñoz-Torres主持了讨论。

一些关键点:

对数据共享的态度:世代相传的问题?

Carole Goble分享了一个有趣但有些令人失望的事实:虽然年轻人(例如博士生)通常公开数据,但考虑到花费的时间和金钱带来的巨大挑战,项目中的PI更可能对此有所抵触证明努力。 在理想的世界中,默认情况下数据将是开放的(不包括不适合使用开放数据的场景,例如个人隐私,健康状况等),从而创造了一个环境,任何共享数据的人都显得很奇怪。

数据“调情”

卡罗尔·戈布尔(Carole Goble)的一句话:不完全的数据共享可以用作一种营销手段,在没有实际提供任何实际用途的情况下,足以引起他人的兴趣!

开放数据:如何防止滥用?

一位有见识的听众问专家小组如何防止开放数据被滥用。 马德琳·鲍尔(Madeleine Ball)回应指出,真正开放的数据确实有可能被滥用,并且在不降低数据开放性的情况下,没有任何阻止它的方法。 也许是一把双刃剑?

尼克·洛曼(Nick Loman)进一步指出,开放源代码也采取了两种方式,朝鲜与其他任何人一样,都从开放源代码软件中受益。 确实,当我简短地搜索此内容时,我注意到Wikipedia上有一篇有关Red Star OS(改进的朝鲜语Linux发行版)的文章。

并非所有数据都应该打开

当来自讨论开放数据的小组来访时,这似乎令人惊讶,但是即使在个人基因组学,健康,位置,隐私等方面推动道德问题,也有其他原因隐藏数据。

保护和生态就是很好的例子。 发布使用稀有,有趣或易受攻击的动物的位置可能会导致其伤害或死亡,无论使用该数据的人是恶意的还是只是好奇地看到该动物。 我最近实际上对自己有一个经验-我住在剑桥郡的芬兰兹县(确切地位置一直含糊不清),在观鸟的同时我有幸发现了一对鹤,这种鹤在英国非常罕见,以至于它们的唯一繁殖地是为自己的安全保密。

重新数字化

希尔玛·拉普(Hilmar Lapp)在听众中提到,有时仅“开放”数据是不够的-它必须采用明智的格式。 这可能是学术发布模型有改进空间的地方-例如,不应将大量表格数据转换为PDF格式,在此处可能必须手工重新键入整个数据集才能重新创建。 -使用数据。

他进一步断言,对数据进行重新数字化的行为具有足够的变革性,不仅公开许可数据是合法的,而且实际上是一种义务,以免相同的数据被不同方重复进行数字化。 (旁注–有人可以验证这一说法吗?我想听听更多。)

在我看来,这个问题类似于数字黑暗时代,这是一个非常现实的问题,随着技术的发展,我们将不再拥有读取旧数据格式的硬件或软件。

感谢您到目前为止与我一起阅读。 我将结束我的最后一篇文章,即将发表,其中将总结BOSC第二天的主题演讲,这是尼克·洛曼(Nick Loman)发表的鼓舞人心的演讲,内容涉及通过对病毒暴发的基因组进行测序来改变疫情流行国家。

免责声明: 任何表达的观点都是我自己的,不一定是PLOS的观点。