开放科学工作室分享 http://blog.sciencenet.cn/u/OPENRESOURCES

博文

arXiv用户调研报告 编译 精选

已有 7339 次阅读 2016-8-3 19:40 |个人分类:新闻类|系统分类:海外观察| 用户, 调研报告, arxiv

原文https://confluence.cornell.edu/display/culpublic/arXiv%20User%20Survey%20Report

 arXiv.orghttp://arxiv.org/)是全球第一个在线预印本系统,也是目前规模和影响力最大的预印本系统,有大约1,163,802个文档。ArXiv内容由科研人员自愿提交,美国康奈尔大学负责对提交的所有预印本进行审核和管理,提交的文章被审核发布到总站和17 个镜像站。arXiv受到科学研究者的积极支持,一半以上的物理学家和数学家曾经将其最新研究成果提交到arXiv。arXiv电子预印本仓储的建立和发展, 加快了科学研究成果的交流和共享,在帮助研究人员追踪学科最新研究进展和避免重复研究等方面都发挥了重要作用。

一、    调研简介

20164月,arXiv团队进行当前服务和未来发展方向的用户调查。调查渠道包括问卷调查和网上开放文字评论。问卷调查共回收3.6万份问卷,代表了arXiv不同类型的用户团体。普遍反应是用户满意现在的服务。95%的受访者表示,他们非常满意或者满意,此外,72%的受访者表示,arXiv应重点关注它的主要目的,即快速提供科学论文,这将足以在未来维持arXiv的价值。这个观点也普遍反映在开放文字评论之中。大量的受访者建议保持核心工作,再使arXiv的合作伙伴和相关服务供应商继续在arXiv上开发新的服务和创新。

许多文字评论反映了用户对于arXiv的深度满意和感激。很多用户表示,arXiv在替代传统出版业的发展上是一个重要的领导者。尤其是独立研究人员和延迟获取到文章的研究人员,特别强调arXiv对他们工作的重要性。

      问卷中选择题的多种多样的答案和广泛的、深思熟虑的开放文字评论综合指出了arXiv需要升级和增强的区域:改善搜索功能成为首要任务,用户对于当前可用的有限的搜索能力表示极大的不满,尤其是在作者搜索方面;提供对研究数据、代码、幻灯片或者与论文相关的其它材料的提交和链接更好地支持;继续实施质量控制措施,如检查文本重叠,提交的主题分类正确;拒绝没有科学价值的论文,要求作者解决格式相关的问题;一些用户提出以随机的顺序通过通知或邮件推送新论文;还有一些评论指出需要改善审核机制并提供更多关于审核流程和政策的信息。

一些用户还鼓励arXiv团队大胆思考和通过添加诸如同行评议、鼓励虚拟期刊(overlay journals)的方式进一步推进开放获取(和新形式的出版)。另一方面,许多用户特别强调坚持核心工作的重要性,而不是转移到正式出版。有一个类似的分歧意见还包括是否通过添加评级和注释的功能来鼓励开放的审查过程。有关为arXiv添加新特性来促进开放科学的意见,主流观点认为任何这样的特性都需要非常仔细地和系统地实现,而不应该危及arXiv的核心价值。

虽然许多受访者花时间对未来发展或当前服务的改进提出了建议,但多数用户都尖锐地反对任何改变。评论者一致表示,对于任何想把arXiv变成一个“社交媒体”风格的平台的考虑都应当保持警惕。arXiv总体而言现今工作完成的很好,虽然有一些需要改进的地方,但太多的改变可能会削弱arXiv的有效性和总体任务的完成度。

关键结论

1.提高arXiv当前的服务

·       70%的受访者表示,改善搜索功能来提供更精确的果是非常重要的/重要的,包括使用年限、段、发表的文章数量、国家组织和主题领域的所有内容方面。很多评论要求一些增功能,如作者搜索、限搜索和搜索非英语语言。

  • 提出有关提交程的一系列改进建议(1)研究数据、代、幻灯片和其他材料提交的支持;(2)提高对接到研究数、代、幻灯片等等的支持;(3)更新TeX引擎和其他各种增功能。40%的受访认为每一个都是非常重要的/重要的。尽管受访者不同意由arXiv或其他方主管,但开放的文本响应在更好地支持充材料上仍然出相当的重要性。多受访者支持集成或接到其他服(GitHub),而大量的受访arXiv拥有的内容的期可用性和接失效表示明确的怀疑。一些受访者表示了对arXiv改善问题所需的资源的担忧,也有一些人对论文中的数据挖掘则比较感兴趣。

  • 访者提及的其他服和改有:

o  已发布版本的链接和内容的一致性。

o  更准确的电子邮件或RSS提示。一些受访者要求提供某个特定作者著作的邮件推送,并且在邮件中有著作的有效接。

o  更新和保持当前arXivTeX引擎和提供TeX板或式文件以确保提交更容易。

o  实现交叉引文链接。

o  支持一次上载多种文件,支持提交PDF以及更大文件。

o  直接从作平台提交(如在OverleafAuthorea)

o  提供统计数据,如论文下载和视图。

o  大多数使用年限在5年以内的arXiv户对当前服务升级选择没有意。使用年限越长,选择“没有意见”的用户比例越少。

2.质量控制措施的重要性

·       26430名受访关于质量控制措施的调查中,其中最重要的是(以非常重要的/重要的排名)

o  检查论文文本重叠即,剽窃,77%

o  确保提交的分类正确,64%

o  没有科学价值的论文,60%

o  绝论文自我剽窃,58%

·       77%的受访者认为检查剽窃是重要的,58%还认为检查自我剽窃重要。例如,会议论文是一类在一个本来科学合理的提交机制中也会普遍高发自我剽窃的领域。

·       一些受访者表示,他不知道具体的量控制措施已到位,也程是不透明的。其他人则认同绝没有价值的文章和拒绝因为一些不那么明显的或者匿名的原因的文章之间很难平衡。然而,尽管面对这样的批, 大家对arXiv当前量控制机制非常满意,同时用也提醒不要在其他方面走得太远。

·       一些用户倾向arXiv使用更加开放的同行评审和/或适度的机制,而其他用户则坚认为,相较于传统出版,当前的控制措施对arXiv的访问自由和访问速度功不可没。

·       总的来说量控制问题很重要,但用户在arXiv如何实现这些目标的评论上存在分歧。正如一位受访者写道,“判断量控制是一个相问题”。

3.增加新的学科目录

·       73%的受访者表示不关心新的主添加至arXiv26%的受访者希望看到新的主题类别被添加,建议添加的学科有:化学(881)、工程学(483)、生物学(429)经济(248)、哲学(220)和社会科学(106)有几个小类别,如机器学(82)和人工智能(27)

·       一个较多的观点是,arXiv不需要特关注其他科目而是应该关注分支域和子分化和是在高能物理理以及数学。

4.开发新服务

·       被要求arXiv系列拟议的新服。在排名中,超63%的用户认为参考文献中添加全文链接是非常重要的/重要的。超57%的用户认为BibTexRIS等引文格式是非常重要的/重要的,并且超55%的受访认为BibTeX格式的引文条目提取同样重要。近53%的受访者将引文分析工具列为是非常重要的/重要的。

·       然用普遍偏引用分析工具,但很多用户也指出,其他系经这样,而这些已经能够满足他的需求。

·       问卷调查发现,受访者对于提供一个评级这样读者就能推荐他们找到的有价值的arXiv存在分歧,认为非常重要/重要(36%)和不重要/应该这么做(36%),这个调查结果同开放评论的结果相似。另外,从使用年限来看,使用年限较短的用户(50%)比使用年限长的用户(28%更认为有价值,此外,年轻的用户(30岁以下)(42%)比年纪较大的用户(60岁以上)28%也更认为有价值。的来,所有受访者都一想法不明确。一些用欢评级功能在一个理想状设置,但不认为它适合arXiv;其他人表示担心将稀arXiv的核心任,或者arXiv目前形易出定。然而,即使表示支持的用也提出评级系统是否会公众开放,是否由同行匿名评议等,一些受访强调这种功能仍然需要非常仔细地实现。

·       在问卷调查中,是否添加一个注功能以允许读对论评论的观点也存在同样的分歧34.89%的用户认为是非常重要的/重要,34.08%认为不重要/应该这样做。在开放评论中大部分人都反对并且一些反馈中有强烈的负面情绪。一个普遍的观点是一个成熟的系统和完备的账户应当防止出现所有人自由参议的情况出现。

5.查找arXiv论文

·       绝大多数arXiv的用直接访问文件的主(79%),其次是使用谷歌搜索(50%)和谷歌学搜索(35%)

·       对于,易用性和航是被考虑的32%认为是易用的,但只有25%易用,而21.6%受访者认为使用起来有些困难。

·       对于发现内容方面63%的用在一个特定的类别下从新的或最近的接去发现,同63%的用使用arXiv的搜索引擎,输入一个特定的arXivID、作者名字或者搜索。少量的用14%,依靠每日件列表,然后找一个特定的域的文章搜索。

·       在开放文字评论中,关于用界面方面存在较大的意见分歧。大多数的受访者不喜欢这种过时,但是有特定的小众群体则青睐简单的接口,这些用户感觉这可以帮助arXiv有效地行任。提及的主要问题除了主接的数量、布局和发现提交信息以外,在组织缺乏次,对arXiv航理解方面也存在挑战。

·       增强用户体验相关的要求包括为用户提供更个性化的arXiv。例如,“最喜欢”论文列表,创建一个私人图书馆,网站内容推荐。其他用户则提到开发APIs以进一步促进“虚拟期刊”的发展。一些用户还建议用户友好版本的开发。

·       许多评论者也关注他们如何将其他服内容(特定站点搜索、ADSINSPIRE)arXiv进行交互,或者基于其他信息系经验进行推荐。

附录1:受访者的人数统计

1)我通过以下方式使用arXiv:(在以下选项中选择):

选项

总计

我是arXiv的读者

93%

31862

我是arXiv的作者

53%

18270

我是arXiv的上传者

50%

17189

我是arXiv(的其他类型用户):请描述

2%

845

2)我在arXiv上发表/提交的文章数是:

选项

总计

1篇文章

11.99%

2570

2篇文章

8.95%

1920

3-4篇文章

15.19%

3254

5-10篇文章

23.06%

4941

超过10篇文章

40.80%

8743

总计

100%

21428

3)我当前职业是:(请在以下选择)

选项

总计

我是一名学院或大学的学术教员(教授)

27%

8868

我是一名学院或大学的学术职员(研究人员或博士后)

22%

7207

我是一名非赢利性或政府机构的研究人员

8%

2707

我是一名硕/博士研究生

30%

9890

我是一名大学生

5%

1514

我是(其他)

13%

4353

13%的受访者(4353)来自一个不同的职业类别。最多的包括一个公司或行业的研究员(900)、工程师(515)和退休的人(478)。也有受访者自称科学作家、编辑或自由编辑。其他类型包括数据科学家、自称为业余研究者、自称是外行、失业、老师和一些特别的职业。

4)作为一名用户,我对arXiv主要感兴趣的研究领域是:(请在以下选择)


近2000名受访者选择“其他”选项来指定他们的主要感兴趣的领域。“其他”选项中最多的是天文学 (726)和天体物理学(653)。

5我使用arXiv多久了:

选项

总计

0-2

19.54

6470

3-5

28.96%

9592

6-10

25.44%

8425

11年以上

26.06%

8632

总计

100%

33119

6)我的年龄是:

选项

总计

小于30

37.42%

12364

30-39

31.27%

10332

40-49

13.76%

4545

50-59

9.30%

3073

60-69

5.77%

1908

70岁及其以上

2.47%

817

总计

100%

33039

附录2:有关arXiv现今服务和未来发展方向的建议


1)改善arXiv的以下当前的服务有多重要?



问题

非常重要&重要

有些重要

不重要&不该这样做

未选

改善搜索功能允许更细化的结果(如,通过附加搜索条件缩小结果范围,通过出版年份或者机构过滤等等)

70.38%

19.34%

6.14%

4.13%

对提交研究数据、代码与论文相关的幻灯片和其他材料的支持(如,我希望能够上传我的文章数据集/机器可读的表)

41.95%

22.64%

14.03%

21.37%

提高研究数据、代码、与论文相关的幻灯片和其他材料等与论文的关联(如,我希望能够在SlideShare上链接到幻灯片)

40.65%

25.20%

17.70%

16.45%

通过更新Tex引擎支持提交研究报告:

39.36%

23.17%

16.71%

20.76%

改进电子邮件提醒系统,以便读者可以改善他们的设置和选择接收有关特定的副标题的提醒:

37.85%

26.48%

20.25%

15.42%

完善跟踪机制(链接文件到引用的博客和评论)

36.52%

29.50%

20.30%

13.67%

通过提供更清晰的说明和简单的语言简化提交过程:

32.45%

22.55%

25.20%

19.80%







2)开发arXiv以下新服务有多重要?

问题

非常重要&重要

有些重要

不重要&不该这样做

未选

添加参考文献的论文链接:

63.04%

26.89%

5.78%

4.29%

提供BibTeXRIS等格式的引用格式导出:

57.68%

23%

10.95%

8.37%

提取arXivBibTeX格式引文:

55.54%

23.82%

9.72%

10.91%

提供引文分析工具:

52.95%

27.08%

14.28%

5.69%

支持符合公共/开放获取授权(按照资助机构政策需要公开研究成果)允许最终版本的论文提交信息,如资金来源和资助号:

42.06%

26.21%

13.68%

18.05%

提交一篇论文到期刊的同时上传到arXiv

39.28%

23.09%

25.23%

12.40%

提供一个评级系统,这样读者可以推荐他们发现的有价值的arXiv的论文:

36.28%

21.76%

35.56%

6.40%

同其他机构库(如,图书馆运行的机构库)链接(互操作性),这样arXiv一篇论文被接受的同时其他存储库也被接受:

35.25%

28.14%

17.25%

19.36%

开发一个注释功能将允许读者评论论文:

34.89%

23.62%

34.08%

7.41%

3)您在哪里发现arXiv论文?请在以下选择:

选项

%

总计

直接前往arXiv.orgarXiv主页)

79%

22804

ADS

14%

4144

Inspire

13%

3773

谷歌学术搜索

35%

10016

谷歌

50%

14440

arXiv邮件提醒

14%

4086

其他搜索引擎

5%

1402

arXIv的主要门户,如Math Front

4%

1203

其他(请具体填写):

9%

2662

4)如果您使用了arXiv主页发现论文,它的导航使用难易度是?

选项

%

总计

十分容易

14.85%

3916

容易

32.05%

8450

还算容易

25.20%

6644

有点难

21.60%

5696

困难

5.02%

1324

非常困难

1.27%

336

总计

100%

26366

5如果您使用过arXiv主页,您通常如何浏览主页?请在以下选择:

选项

%

Count

在特定类目下链接到新论文或者最近记录

63%

16503

使用arXiv搜索引擎并输入具体的arXiv  ID、作者名字或者检索词

63%

16478

接收每日邮件列表,并且在研究领域找寻特定论文

14%

3692

其他,请解释:

3%

853

6现行的以下质量控制措施重要程度是?

问题

非常重要&重要

有些重要

不重要&不该如此

未选

arXiv检查论文的文本重叠:作者使用太多相同的文本与其他作者的论文,但并没有明确说明文本不是自己的材料,即“抄袭”

77.41%

14.66%

4.96%

2.96%

arXiv确保提交的分类正确(主题类别)

64.38%

25.32%

7.01%

3.29%

arXiv剔除(拒绝)没有多少科学价值的论文

60.02%

19.14%

15.49%

5.35%

arXiv检查作者对自己文本的重用,即,“自我抄袭”(没有标注引用的重用自己相同的内容):

57.77%

24.64%

14.08%

3.51%

arXiv检查论文格式相关问题(文本行号、缺少引用、超大的提交量等),要求作者在提交前修正

55.00%

29.83%

11.51%

3.66%

arXiv在添加允许的链接前完善科学内容的反馈(博客和评论的链接)

39.60%

26.31%

17.59%

16.50%

7)总之,您对arXiv是否满意?

选项

%

总计

非常满意

52.92%

14770

满意

42.43%

11841

还算满意

3.55%

990

不太满意

0.54%

150

非常不满意

0.15%

42

未选

0.42%

116

总计

100%

27909

8)您最认同下面哪个有关arXiv继续向前发展的看法?

选项

%

总计

arXiv应当着重关注在其主要目标上,这将能更快地获得科研论文,这也将足够提升arXiv的未来价值。

71.94%

19865

arXiv应当拓展其主要领域,并花费更多时间和资源开拓新的服务,这对于提升arXiv未来价值是必要的。

19.59%

5410

无看法

8.47%

2340

总计

100%

27615

(编译:王楠  陈雪飞)



https://blog.sciencenet.cn/blog-1035376-994322.html

上一篇:国外动态:全球突发公共卫生事件数据实现开放共享
下一篇:如何避开可疑性OA出版商的“陷阱”?
收藏 IP: 159.226.100.*| 热度|

3 黄永义 吉宗祥 胡升华

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-19 19:09

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部