arXivの総合調査

arXivの概要と歴史

創設と目的 – arXivは、物理学者ポール・ギンスパーグが1991年に開設したプレプリント・サーバーであり、論文が査読される前でも研究成果を速やかに公開し、研究者間の情報共有を促進することを目的としている。当初は物理学向けの電子メール配布リストとして始まり、現在は物理学・数学・計算機科学・統計学・量的生物学・量的金融・経済学・電気工学およびシステム科学など幅広い分野を扱う。この公開モデルは、後のBudapest Open Access Initiativeなどをはじめとするオープンアクセス運動に影響を与えた

運営組織 – サーバーはコーネル大学のCornell Tech(ニューヨーク市)により運営され、科学諮問委員会や編集諮問委員会など複数のアドバイザリー・ボードの支援を受けている。コンピューター科学や数学など各分野にはボランティアの専門家が編集者として付き、投稿された論文の分類と学術的な適正を確認するが、査読は行わない。2022年時点では4人のスタッフと約196人のボランティアモデレーターで1日あたり約1,200本の新規投稿と1,000件の改訂を扱っていた

投稿とモデレーションの仕組み

投稿プロセス

登録ユーザーであれば無料で論文を投稿できる。投稿された論文は以下の基準に基づきモデレーターがチェックし、正しい分類と最低限の学術水準を満たすかを確認する

  • 査読は行われない – arXivは査読システムを持たないが、モデレーターは引用や用語の適切さ、研究分野への関係性などを確認する

  • AIツールの使用 – 著者が生成AI(ChatGPT等)を大きく使用した場合は、使用した旨を明記し、出力の内容に責任を負う必要がある。AIツールを著者として記載することは禁止されている

  • エンドースメント制度 – 初めて投稿する研究者は、該当分野で既に論文を発表したアカウントからのエンドースメント(推薦)が必要である。2026年1月21日に更新された新しいエンドースメント・ポリシーでは、単に大学などのメールアドレスを持つだけでは自動承認の条件にならず、該当分野での既存論文への共著または個人による推薦が必要となった。この変更は低品質投稿や生成AIによるスパム的投稿の増加に対応するためのものである。数学カテゴリでも同様の方針が2025年12月に導入された

  • レビュー論文とポジションペーパー – 2025年10月にコンピュータ科学カテゴリの運用が変更され、レビュー論文やポジションペーパーは査読付きの学会や雑誌に採択されていなければ投稿できなくなった。投稿の際には査読を終えたことを示す情報(ジャーナル掲載情報やDOI)を添付する必要がある。この変更は、生成AIによる質の低いレビュー論文が大量に投稿され、モデレーションが困難になったことへの対応策である

  • 非英語論文の翻訳要件 – 2026年2月11日以降、非英語で書かれた論文を投稿する場合は全文の英訳を添付する必要がある。従来は英語の要旨のみで良かったが、より多くの読者に届くよう政策が改定された

  • 休日の発表スケジュール – 2026年1月のMartin Luther King Jr. Dayなど、アメリカの祝日には新着論文のメール配信が1日遅れになることが告知されている。サーバー自体は稼働しており投稿も受け付けている。

モデレーション体制

モデレーターは各分野の専門家であり、投稿論文が科学的な価値を持つか、既存の研究と重複していないかを確認する。ボランティアのモデレーターは数百人規模で、エディトリアル委員会が承認している。モデレーションは以下の特徴を持つ。

  • 迅速なスクリーニング – モデレーターは提出後すぐに論文をチェックし、不適切な分類・重複・明白な誤りなどを訂正する

  • 分類の再割り当てや却下 – 論文が対象分野と合致しない場合は、他カテゴリへの再分類または却下されることがある

  • 控訴制度 – 不採択の判断に不服がある場合、著者はエディトリアル委員会に控訴できる

投稿数と成長

arXivは世界最大級のプレプリントサーバーに成長している。

  • 総投稿数 – 2026年1月26日時点で累計2,938,601件の投稿があり、利用可能な論文数は2,941,032件に達している。2024年10月には1か月で24,226件の新規投稿があり、前年7月の記録(21,794件)を上回った。この時、コンピュータ科学の機械学習(cs.LG)、コンピュータビジョン(cs.CV)、自然言語処理(cs.CL)カテゴリが6,000件以上を占めた

  • 日々の投稿量 – 2022年時点で1日約1,200件の新規投稿と1,000件の改訂が処理されていた。急増する投稿に対応するため、モデレーションとインフラの強化が進められている。

  • 分野別傾向 – 物理学と数学は歴史的に主要なカテゴリだが、近年は機械学習や生成AIに関連するコンピュータ科学領域の投稿が急増している。大量のレビュー論文やAI生成論文が問題となり、2025年の方針変更につながった

資金調達とメンバーシップ

資金源

arXivの運営費は、コーネル大学、Simons Foundation、機関メンバー、協賛企業、財団、個人寄付など多様な支援に支えられている。また、NASAとSchmidt Sciencesからの700万ドル超の寄付により、クラウドインフラへの移行や個別推薦ツールの開発など技術基盤の刷新が進められている

メンバーシップの仕組み

メンバーシップは持続的な運営を支える主要な財源であり、運営予算の50%以上を占める。2025年に新設されたAll Starメンバーシップを含む複数のレベルが用意され、大学や研究機関が予算に合わせて選択できる。

メンバーシップ種別 対象機関の投稿ランキング All Star年会費 Standard年会費
Top 100 上位1〜100校 6,500ドル 5,000ドル
Frequent 101〜500位 3,250ドル 2,500ドル
Regular 501位以下 1,400ドル 1,000ドル

この他に、10,000ドルのChampionメンバーシップや、標準料金より上乗せしてarXivを追加支援するAll Starメンバーシップが用意されており、より大きな支援を提供した機関はブログやニュースレターで名前を取り上げられる。さらに、予算が限られている機関でも寄付できるCommunityメンバーシップがあり、任意の額で参加できる

メンバー特典

メンバー機関には、サイト上やIPアドレスベースのバナーでの謝意表示、ガバナンス参加資格、機関別投稿統計へのアクセス、アンケートへの参加機会、年次報告書の受取などの特典がある。All StarやChampionのように上位メンバーシップに加入すると、ニュースレターやウェブサイトでの強調掲載といった追加の認知が得られる

arXiv Labsと技術基盤

arXiv Labsは、コミュニティ主導でarXivに新機能やツールを追加するためのプラットフォームである。2025年11月、技術チームがクラウド移行などの基盤整備に集中するため、新規提案の受付を一時停止すると発表した。既存のarXiv Labsプロジェクトは継続しており、将来的にはクラウド環境上でより柔軟な機能拡張が期待されている。

社会的インパクトと評価

オープンアクセスへの貢献 – arXivは、世界中の研究者が無料で最新研究を閲覧できる場を提供し、研究成果の早期公開を促進した。SPARCによる紹介では、世界の研究者に機会均等をもたらし、他のプレプリントサーバーのモデルとなったと評価されている。2021年時点で約200万件の論文が登録されており、その後も急増している

批判と課題 – 査読を行わないため、誤った研究や不完全な結果が広く拡散される可能性がある点が長年の課題である。特に近年は大規模言語モデルの発展に伴い、AI生成の低品質なレビュー論文やポジションペーパーが急増し、研究コミュニティの信頼性を低下させる「DDoSアタック」のような状況を招いている。この問題への対処として、レビュー論文に対する新しい投稿要件(査読済みであることの証明)が導入された。さらに、arXivは生成AIの使用について透明性を求める方針を策定している

将来の展望

arXivは今後、クラウドインフラへの全面移行や個別推薦機能の開発など、技術基盤の刷新を進めている。これにより急増する投稿を効率的に処理し、検索性やユーザー体験を向上させることが期待される。さらに、エンドースメントの強化や英語翻訳の義務化といったポリシー変更は、科学的価値の高い論文に焦点を当て、研究コミュニティの信頼を守るための取り組みである。今後もコミュニティからのフィードバックを受けつつ、オープンアクセスの旗手として発展していくであろう。

あわせて読みたい