A Quantitative Profile of a Community of
Open Source Linux Developers

Bert J Dempsey, Debra Weiss, Paul Jones, and Jane Greenberg

UNC Open Source Research Team (see note 1)

School of Information and Library Science

University of North Carolina at Chapel Hill

Chapel Hill, North Carolina 27599-3360

osrt@metalab.unc.edu

October 6, 1999

Abstract

Open source software, or free software, has generated much interest and debate in the wake of a number of high-impact applications and systems produced under open source models for development and distribution. Despite the high degree of interest, little hard data exists to-date on the membership of collaborative open source communities and the evolutionary process of their repositories. This paper contributes a baseline quantitative study of one of the oldest continuous repositories for the Linux open source project (the UNC MetaLab Linux Archives), including demographic information on its broad community of developers. Our methodology is a close examination of collection statistics, including custom monitoring scripts on the server, as well as an analysis of the contents of user-generated metadata embedded within the Archives. User-generated metadata files in a format known as the Linux Software Map (LSM) are required when submitting open source software for inclusion in non-mirrored portions of the MetaLab Linux Archives. The over 4500 LSMs in the Archives then provide a demographic profile of contributors of LSM-accompanied software as well as other information on this broad subset of the Linux community. To explore repository evolution directly, an instrumented Linux Archives mirror was developed, and aggregate statistics on content changes seen over a month-long period are reported. In sum, our results quantify aspects of the global Linux development effort in dimensions that have not been documented before now, as well as providing a guide for more detailed future studies.

オープンソースソフトウェア、あるいはフリーソフトウェアは多くの興味や議論 を引き起こし、結果として数多くの衝撃的なアプリケーションやシステムが、 オープンソースモデルのもとに開発・配布された。
しかしその関心の高さにもかかわらず、現在まで僅かのハードデータしか オープンソースコミュニティやそのレポジトリが成長する過程には存在しなかった。
この論文では(a baseline quantitative study)の一つであり 古くから続いているLinuxのオープンソースプロジェクト(the UNC MetaLab Linux Archives)を広大な開発者コミュニティの統計的情報も含めて論ずる。
我々は集合統計(collection statics)の方法論を使い、サーバーに 監視スクリプトを置くと同時に、ユーザーが生み出した、アーカイブに埋めこま れているメタデータの中身も解析する。
ユーザーが生み出したメタデータファイルのフォーマットは Linux Software Map (LSM) として知られておりMetaLab Linux Archivesのミラー されていない部分に提出する時は、このフォーマットを要求されるようになっている。
広いLinuxコミュニティーの部分集合としてLSMアーカイブが提供している。 それに伴ってソフトの貢献者の履歴を統計として4500以上のLSMのアーカイブによって提供されて いる。
レポジトリの進化を直接探求することでLinux のアーカイブミラーサイトは成長し、 月次で報告される中身の変化が統計的に集まる。
要約すると、我々の研究結果は、全世界的なLinux開発の現状を今までにない 角度からに定量分析(quantify)し、と同時により詳細な将来の研究への指針を示す

Introduction

Open source development communities have successfully created, distributed, and continued to evolve many important software projects---the GNU project's utilities and libraries including the gcc compiler and Emacs editor, the Perl and Tcl languages, the Apache WWW server, and the Linux and FreeBSD operating system. Open source, or free software, means more than access to source code (see Appendix A), and there is not universal agreement on a single open-source development model. Nonetheless, the guiding principle for open source software is that, by sharing source code, developers cooperate under a model of rigorous peer-review and take advantage of "parallel debugging" that leads to innovation and rapid advancement in developing and evolving software products. Open-source licensing, moreover, ensures an open market in integration and support for these products downstream.

Introduction
オープンソース開発コミュニティは、下のようなユーティリティやライブラリを含む GNU Projects のような、 数多くの重要なソフトウェアプロジェクトの開発、配布、そして発展を続けるのに成功してきた。

オープンソース (あるいはフリーソフトウェア)とは、ソースコードにアクセスできるだけではなく、 ある一つのオープンソース開発モデルという一般的な合意があるわけではない。
ソースコードを共有することで、「並行したデバッグ(parallel debugging」が可能となる。

Software production and distribution driven by the open source model thus has strong practical advantages as well as its strong appeal to those who, in Richard Stallman's words, see open source software in a "social advantage, allowing users to cooperate, and an ethical advantage, respecting the user's freedom. [3]" Advocates emphasizing the business reasons for adopting an open source model have engendered in recent years an on-going---and often acrimonious--- debate over the ultimate impact of open source communities. Some have proposed that free software methods leveraging the Internet represent an alternative economic model for engendering and managing robust software that will dramatically reshape the multi-billion dollar commercial software industry. Skeptics meanwhile continue to challenge the idea that the technical and organizational approach represented by open-source development can really scale up in the coming years and produce the robust software required for large-scale mainstream computing [1]. The stakes in this debate are clearly quite high.

「協調作業できる社会的な利点と、ユーザの自由に応えることのできる倫理的な利点」(Richard Stallman)
インターネットを利用したフリーソフトウェアの手法は、 数十億ドルもの商用ソフトウェア工業の新形態となる強いソフトウェアを生みだし管理する、 既存のものに変わる新しい経済モデルを象徴している。

A prime difficulty in understanding and drawing conclusions about open source collaborative development has been the sketchy information available on exactly who participates in open source development and how their software archives evolve. This lack of information is understandable given the distributed, organic process of collaborative development in open source communities.

オープンソースの協調的な開発についての結論を理解し描く事の根本的な問題は、 オープンソース開発に加わった人が正確に手に入れることのでき、どのように彼らがソフトウェアのアーカイブを展開するかについての、 不完全な情報である。 この情報の欠如は、分散されたオープンソースコミュニティにおける協調的な開発の有機的なプロセスによって理解できる。

The contribution of this paper is a baseline quantitative study of a broad community of developers within the Linux open source effort, which, due to its influence and increasing user base, is widely regarded as a cornerstone project for large-scale open-source development. Our work characterizes a very large repository of Linux-related materials and analyzes information embedded within the collection on the nature of its contributors. Derived from a variety of collection meta-data statistics, the data and analysis here supports the assertions that Linux community is indeed very vibrant, geographically diverse, and engaged in a broadening the quantity and scope of the freely available Linux software and documentation.

この論文が貢献するところは、 その影響と利用者基盤の増加により、大規模なオープンソース開発の土台となるプロジェクトとして広く注目されている、 Linux オープンソースの試みの、広い開発者コミュニティの基本的な定量的調査である。 私たちの作業によって、Linux に関連する素材の非常に大きなレポジトリを特性を示し、 さらにその共同開発の自然なコレクションを含んだ情報を分析を行っている。 多様なメタデータの分析のコレクションによって、 データとこの分析は、Linux コミュニティは実際にとても活気にあふれ、地理的に分散し、 そして自由に手にはいる Linux のソフトウェアやドキュメントの量や範囲は広がっているという主張を補強している。

Background on Open Source Development

The genesis of the open-source model for software development and distribution goes back to the earliest days of software in university environments. Open-source software is an alternative term for "free software", which was popularized by the seminal Free Software Foundation, founded in 1984 by MIT researcher Richard Stallman. The Free Software Foundation is the parent organization for the GNU (GNU's Not Unix) project. Stallman's vision was to develop a free operating system, complete with standard software tools such as compilers, interpreters, text editors, mailers, and so forth, in order to recreate a community of cooperating hackers that he felt had been lost . Under his direction, the Free Software Foundation popularized the term "free software" as explained in the now-classic distinction, free as in "free speech", not "free beer". That is, free software may or may not be distributed with a monetary cost, but the knowledge that underlies the program, i.e., the source code, should be freely available in order to empower future innovation. Software source code is a form of scientific knowledge, and just as scientists publish so that other scientists can build on their results, computer scientists must publish their source code in order to foster continued innovation in computing.

Background on Open Source Development
ソフトウェア開発・配布のオープンソースモデル時代は、ソフトウェアの学術環境であった昔の時代に逆戻りしている。 オープンソースのソフトウェアは、1984年にMITの研究者 Richard Stallman の設立した、 生産的な(seminal) Free Software Foundation によって有名になった、『フリーソフトウェア』の言い換えである。 The Free Software Foundation は、GNU(GNU's Not Unix) Project の親組織である。 Stallman の野望は、既に失われた(とStallmanの考えている)協調的なハッカーのコミュニティを復活させるため、 コンパイラ、インタプリタ、テキストエディタ、メイラ等の標準的なソフトウェアツール等を完全に含んだ、 フリーのオペレーティングシステムを開発することである。 この目的の元で、Free Software Foundation は、『フリーソフト』という言葉を、 『自由な表現』であり『無料のビール』ではない、という古くて新しい特徴で説明している。 これは、フリーソフトウェアは原価で配布されるかもしれないが、ソースコードなどのプログラムにある知識は、 将来において革新的に力を与えるために、自由に手に入れることができるべきである。 ソフトウェアのソースコードは科学的な知識の一つの形であり、 他の科学者がその結果を作り上げることができるように、この科学的な出版は、 コンピュータの革新が続けるのを助長するために、そのソースコードを公開しなければ行けない。

Unfortunately, the term "free software" has negative connotations for many in the commercial computing world, and the tone adopted by Stallman, the most prominent free software advocate for some time, was distinctly anti-business. In early 1997, a group of leaders in the free software community decided to address this problem head-on with a marketing campaign designed "argue for 詛ree software' on pragmatic grounds of reliability, cost, and strategic business risk." . They were goaded to action largely by frustration over what they felt was the unrecognized potential of free software as a driver of innovation and the basis for the development of commercial-grade software, despite the successes of Apache, Linux, and other projects. An initial decision of the group, which would become the Open Source Initiative, was to choose the term "open source" for their campaign to avoid the baggage being carried by the term "free software".

不幸にも『フリーソフトウェア』という言葉は、商用コンピューティング世界において、否定的に暗示しているので、 かねてからフリーソフトウェアの最も重要な支持者であった Stallman によって適応された論調は、 はっきりと非商業主義となった。 1997年初頭に、フリーソフトウェアコミュニティの指導者の一団はこの問題を、 『信頼性、費用、戦略的な事業上のリスク等の実際的な面からフリーソフトウェアを論じ』ることで、 市場競争で真っ向から解決する事にした。 Apache、Linuxやその他のプロジェクトが成功している関わらず、 市販の(commercial-grade)ソフトウェアの開発の基礎や革新の動力としての、 フリーソフトウェアの未知の可能性についての不満によって、 彼らは大きく動くように追い立てられている。 Open Source Initiativeとなったこのグループの最初の決定は、 『フリーソフトウェア』という言葉の代わりに『オープンソース』という単語を選ぶことだった。

A key component of Stallman's effort in developing a successful free software organization was to formulate a licensing agreement that would prevent businesses from taking free software and using it in binary-only redistributions for commercial gain. Stallman developed the GNU General Public License, known as the GPL or "copyleft", to address this issue. In subsequent years, other open-source efforts adopted variations on copyright statements designed to enable open-source works to thrive while not hampering the ability of developers to incorporate open-source work effectively (see note 2). For its part, The Open Source Initiative adopted a set of criteria, titled "The Open Source Definition", for open-source licensing. Based on an earlier document by Bruce Perens, the Open Source Definition explicitly mentions some example licenses that fit its criteria, including that of the GNU project (the GNU GPL), the Berkeley Unix Project (BSD), the X Consortium, and a few others. For reference, the Open Source Definition, Version 1.7, is reproduced in Appendix A.

成功したフリーソフトウェア組織を作る Stallman の試みのうち鍵となるのは、 フリーソフトウェアが商業に使われたり、営業的な利益のためにバイナリのみで再配布するのを防ぐライセンスを作ることだった。 Stallman はこの問題を解決するために、 GPL あるいは 『コピーレフト(copyleft)』として知られる GNU Generan Public License を作成した。 翌年、その他のオープンソースの活動は、 オープンソースの活動は効果的に協調する開発者の可能性を妨げないので、 オープンソース活動を繁栄させる著作権条項の種々に適応した。 この部分では、Open Source Initiative は、オープンソースのライセンスのために、 『The Open Source Definition』という基準を適応した。 Bruce Perens の初期の記述によると、The Open Source Definition では、 the GNU Project (the GNU GPL)、the Barkeley Unix Project(BSD)、the X Consortium と他の僅かの、 その基準に合う幾つかの例を出している。 参考までに、the Open Source Definition Version 1.7 は、Appendix A として収めている。

Linux: Open-Source Development on a Global Scale

Internet connectivity has enabled the open-source notion of cooperative, peer-reviewed software development to be deployed on a global scale. Perhaps the most influential open-source project to-date has been and continues to be the Linux operating system. Linux began as a personal project of a graduate student in Finland, Linus Torvalds, in 1991. The Linux project now represents a mature operating system that runs on the popular hardware platforms. Linux is playing an increasingly significant role in the business plans of established computing companies, in university research labs, and in the development of a new set of companies focused on Linux support and integration issues. According to April 1999 statistics at the Internet Operating System Counter site , Linux is now the operating system at over 30% of Internet server sites. Linux has been estimated to have 10 percent of the server market share in the Unix market with growth trends suggesting it will dominate the Unix arena in a few years.

Linux: Open-Source Development on a Global Scale
インターネットのコネクティビティによって、協力的で相互に評価し合えるソフトウェア開発は、 地球規模のスケールで分散することが可能となった。 この影響をもっとも受けたオープンソースプロジェクトは、Linux オペレーティングシステムだろう。 Linux は現在、一般的なハードウェアプラットフォーム上で動作する、成熟したオペレーティングシステムとなっている。 Linux は、コンピュータ企業のビジネスプランや、大学の研究室、 そして Linux のサポートや統合化(integration issue)を行おうとしている企業の新しい?において、 より重要な役割を果たそうとしている。
1999年4月のInternet Operating System Counterによる統計によると、 Linux はインターネット上のサーバにおいて30%以上を占めており、 UNIX市場に置いて、サーバ市場の10%を占めるほどに評価されている

The Linux Kernel Project continues to be led by Linus Torvalds himself, with a significant array of co-developers throughout the world. In addition, the Linux community of application-level developers and documenters has grown in proportion with the rising tide of users and installed systems. In a recent interview, Linus has said that in the near future "the most exciting developments for Linux will happen in user space, not kernel space ." Thus, increasing focus and energy are now being directed towards creating applications and utilities that will spread the use and usefulness of the Linux kernel work.

Linux の Kernel Project は、Linus Torvalds 自身と、世界中の共同開発者によって指揮されている。 アプリケーションの開発者や documenter は、ユーザやインストール済みのシステムの上昇機運に応じて増えている。 最近のインタビューで Linus は、近い将来 Linux においてもっともexcitingな開発はユーザ空間であり、カーネルではないだろうと言っており、 増え続ける注目やエネルギーは、ユーザの便利さを広げるアプリケーションやユーティリティを作る事に向けられている。

The focus of this paper is with this latter group, which we call Application Contributors to distinguish them from the contributors within the Kernel Project itself. A priori, the overlap between these Application Contributors and developers in the Kernel Project is unknown. Linus and other prominent Linux developers do show up in the set of Application Contributors. As a group, the Application Contributors would be expected to represent a broader range of contributors since their contributions are non-juried and include those who make small contributions of specific applications or utilities. (Application contributions can also be very large and complex programs, e.g., a Linux port of the Sendmail server.)

この論文の焦点は、私たちが「アプリケーション Contributor」と呼ぶこの近頃のグループであり、 Kernel Project とは異なる。 先天的に、アプリケーションの共同開発者と、Kernel Project の開発者の共通点は知られていない。 Linus やその他の重要な Linux の開発者は、アプリケーションの共同開発者の中でも有名である。 グループとしてアプリケーションの共同開発者は、ほんの少しの貢献しかしない人など、幅広い範囲を含む。

To explore the nature of contributions by Application Contributors and their collective profile, the paper presents a discussion of collection and server statistics gleaned from one of the oldest and most comprehensive Linux repository site, metalab.unc.edu, run by UNC MetaLab (formerly the original SunSITE). With components of the repository at MetaLab mirrored from other key Linux sites (e.g., www.redhat.com and kernel.org), the MetaLab collection includes virtually all Linux-related materials available on the WWW, including all major distributions of the base kernel code, the Linux Documentation Project (coordinated and hosted by MetaLab), and a large archive of contributed software and auxiliary materials. Our study specifically focuses on this latter portion of the MetaLab archives, and its contributors are, by definition, the community of Application Contributors that we profile.

この論文では、もっとも古い総合 Linux レポジトリサイトの一つである、metalab.unc.edu から集めた、 コレクションとサーバの統計について議論している。 この MetaLab では、www.redhat.com や kernel.org のような他の主な Linux sites をミラーし、 各種ディストリビューションや、Linux Documentation Project 、そして大きなソフトウェアやその他の素材を含む、 WWW から手に入れることのできる Linux に関連する全ての素材を(仮想的に)含んでいる。 私たちの研究では具体的に、MetaLab アーカイブの最近の一部分と、 私たちが評価するアプリケーション共同開発者のコミュニティについて、焦点を当てる。

Towards this effort, we analyze the approximately 4500 user-generated metadata files (Linux Software Maps (LSMs)) embedded within the collection materials. The LSMs offer self-reported information on the demographics of Linux developers involved mostly in application-level tools and utilities (as opposed to the largely separate Linux Kernel Project) as recorded over a 5-year period. Also, we collected data on repository changes across a large portion of the MetaLab archives by instrumenting a month-long monitoring experiment on the MetaLab server. This experiment yielded data on the global pattern of change in repository contents.

この試みに応じるため、およそ4500の、それぞれの素材に付いているユーザの作ったメタデータ(Linux Software Map(LSM))を分析した。 LSM は、アプリケーションレベルの開発者によるプロフィールを提供している。 この記録は5年に及んでいる。 MetaLab アーカイブの大部分にわたり、リポジトリの変化についても収集した。 これにより、リポジトリ内容の変化のおおまかなパターンをもたらした。

Below we briefly review the history of the Linux repository at MetaLab and the role of LSMs in the archive. The sections following then present our quantitative profile of the collective set of LSM-based contributors and patterns of content change.

このあと、MetaLab の Linux リポジトリの歴史と、LSMのアーカイブに置ける役割をざっと復習する。 さらに次の章では私たちの、LSM をベースとした共同開発者や、内容の変化のパターンの収集による、定量的な分析している。

History of Linux Repository at UNC MetaLab

Not long after Linus Torvalds released his first copy of the Linux kernel to the Internet in 1991, an American mirror of his FTP site was established at banjo.concert.net in the Raleigh-Durham area of North Carolina. However the Linux project was growing quickly and soon banjo was short of disk space. In 1992, Jonathan Magid, who had just become the student systems administrator of a new project called SunSITE at the University of North Carolina, agreed to take on not only the mirror but to collect contributions of Linux-related software. Since then the site, now MetaLab.unc.edu, has been a major resource for the Linux community--both developers and users.

UNC MetaLab における Linux レポジトリの歴史
Linus が 1991年に最初の Linux kernel をインターネットに公開してからすぐに、 その FTP サイトのアメリカのミラーが、ノースカロライナのローリーダラム地域にある banjo.concert.net に設置された。 だが、Linux project はすぐに大きくなり、banjo のディスクスペースでは足りなくなった。 1992年、ノースカロライナ大学においてSunSITEと呼ばれる新しいプロジェクトの学生のシステム管理者になった、 Jonathan Magidは、ミラーだけでなく Linux に関連するソフトウェアを集めることを認めた。 そして、現在 MetaLab.unc.edu となったこのサイトは、Linux の開発者・利用者両方のコミュニティの主要な資源となっている。

The over 125,000 files in the Linux repository at UNC MetaLab is available through FTP and HTTP under the /pub/Linux portion of the server. We will refer to these materials henceforth in this paper as the MetaLab (ML) Linux Archives or the MetaLab (ML) Linux repository. As noted above, our LSM-based analysis focuses on the subset of the ML Linux Archives in which LSMs play a prominent role, namely the /pub/Linux tree excluding the docs and distributions subdirectories. Along with other collections, /pub/Linux is served from high-performance machines connected with excellent high-speed Internet connectivity. Not infrequently, access counts to the ML Linux Archives via HTTP and FTP exceed 100,000 transactions per 24-hour period.

UNC MetaLab の Linux レポジトリにある 125,000 以上のファイルは、 このサーバの /pub/Linux 以下の部分にあり、FTP と HTTP を経由して手に入れることができる。 これらの素材を、この論文の以下では、MetaLab(ML) Linux アーカイブあるいは、MetaLab(ML) Linux レポジトリとして参照する。 既に述べたように、LSM を基本とした分析では、/pub/Linux ツリーから docs と distributions のサブディレクトリを除いた、 (LSM が重要な役割を果たしている) ML Linux アーカイブに焦点を当てる。 他のコレクションに加えて、/pub/Linux は、超高速のインターネット回線によって接続された高性能マシンによって提供されている。 HTTP と FTP を経由した ML Linux アーカイブへのとても頻度の高いアクセスは、 24 時間に 100,000 以上のトランザクションとなっている。

Contributions to the ML Linux Archives are required to be accompanied by a small metadata file in a format called the Linux Software Map (LSM). This convention arose naturally from the Linux community needs, as detailed in the history below, and as such is widely adhered to by contributors. Since our analysis relies in part on summary information taken from the set of all LSMs, we present a short overview that clarifies the origins and role of LSMs.

ML Linux アーカイブに貢献するには、Linux Software Map(LSM)と呼ばれる小さなメタデータファイルを添付する必要がある。 この決まりは、Linux コミュニティの要求から自然に生じたものであり、 以下の歴史に詳しく述べられているように、共同開発者達に広く支持されている。 私たちの分析は、全ての LSM からの集計情報に依っているので、 LSM の機嫌と役割を明らかにする短い概要を紹介しよう。

History of Linux Software Maps

Although the Linux Archives in 1992 was minuscule compared to its size today, the speed of access for many users and contributors was so slow that just downloading random but interesting files to see if they contained useful software or not. Jeff Kopmanis of Michigan decided that a small descriptive metadata file to be called a Linux Software Map or LSM should be associated with each entry (see note 3). After surfing several gopher sites and posting to various Linux newsgroups and an e-mail exchange with Jonathan Magid, Kopmanis took a close look at a working proposal to the IETF for metadata called Internet Anonymous FTP Archives or IAFA. Kopmanis was working from the 1992 version of IAFA, which he modified to better suit the specific needs of the Linux community. (Interestingly enough the IAFA metadata description has yet to become an RFC and is not widely used).

History of Linux Software Maps
1992年当時、Linux アーカイブは現在の大きさと比べると非常に小さかったにもかかわらず、 数多くの利用者や共同開発者によるアクセス速度は、 適当にダウンロードしてきて、そのファイルが便利なソフトウェアを含んでいるかどうかを確かめて楽しむことができるほどだった。 ミシガン州の Jeff Kopmanis は、Linux Software Map あるいは LSM と呼ばれる小さな記述的なメタデータファイルを、 それぞれの作品に関連させることと決めた。 gopher サイトを幾つか回ったり、Linux のニュースグループに投稿したり、Jonathan Magid とメールをやりとりした後、 Kopmanis は Internet Anonymous FTP Archives (IAFA) と呼ばれるメタデータの working proporsal を IETF で見つけた。 Kopmanis は、IAFA の 1992年の版から作業をはじめ、特に Linux コミュニティのより需要に見合うように作り替えた。
( 面白いことに、IAFA メタデータの記述はRFCとなるに十分だったが、広く使われていなかった。 )

Kopmanis slightly revised the LSM description (in a version noted by a beginning tag of Begin2) after receiving feedback from other users and contributors. Before changing jobs in August 1994, Kopmanis posted notes to Linux newsgroups asking for a new LSM keeper. Lars Wirzenius of Finland was selected as the new LSM keeper. He instituted several changes to the LSM including:

Kopmanis は、他の利用者や共同開発者からのフィードバックを元に LSM の記述を修正した。 1994年の8月、変更を加える前に Linux ニュースグループに 新しい LSM の管理者を求める投稿をした。 フィンランドの Lars Wirzenius が新しい LSM の管理者に選ばれた。 彼は LSM に幾つかの変更を加えた。

This new LSM (Noted by Begin3 as the first tag) went into effect on August 4, 1994. The template is included in Appendix B.

In October 1996, Wirzenius passed on the job of keeping the LSMs to Aaron Schrab of Indiana who has the job of LSM keeper presently. People with specific interest in LSMs are subscribed to the LSM-workers mailing list at execpc.com. This list is maintained by Schrab.

この新しい LSM は、1994年の8月から効力を持った。 このテンプレートは Appendix B として収めてある。
1996年10月、Wirzenius は LSM の管理を、現在のインディアナ州の Aaron Schrab に引き継いだ。 LSM に特に興味を持つ人は、execpc.com にある LSM-workers メーリングリストに参加している。 このメーリングリストは、Schrab 自身によって運営されている。

Aaron Schrab notes in the LSM.README (see note 4):

All entries have been entered by volunteers all over the world via email using the template below [in the file named LSM.README]. New versions [of the LSM] will appear first on sunsite.unc.edu and will be announced in the newsgroup comp.os.linux.announce. Discussions pertaining to the LSM will be held in the newsgroup, comp.os.linux.misc.

Asron Schrab は、LSM.READM で以下のように言っている。

全ての項目は、下のテンプレートを用いて、世界中のボランティアの手によってメールを経由して入力されている。 (LSM の)新しい版は、sunsite.unc.edu に最初に登場し、 comp.os.linux.announce においてアナウンスされるだろう。

Purpose of LSMs within MetaLab Linux Archives

From their beginning, Linux Software Map entries were designed to help developers make their contributions highly available to users and to other developers by serving as finding aids as well as a standardized means of announcing new software (to comp.os.linux.announce and other newsgroups). LSMs also insure that authors are properly credited if and when their software is integrated into Linux distributions.

MetaLab Linux アーカイブにおける LSM の目的
当初から Linux Software Map の項目は、(comp.os.linux.announceやその他のニュースグループに対しての) 新しいソフトウェアのアナウンスを標準化して提供することで、 開発者がその共同開発者に、利用者や他の開発者がより手に入れやすくできるようにデザインされていた。 LSM は、ソフトウェアが Linux のディストリビューションに入れられるときに、 その作者が正しくクレジットされることの保証もしている。

LSMs are created according to the LSM metadata template consisting of 14 metadata elements, five of which are mandatory. The five mandatory fields are: Title, Version, Entered-date, Description, and Primary-site fields. Information on creating LSMs is keep at http://metalab.unc.edu/pub/Linux/docs/linux-software-map/lsm-template. The LSM metadata schema is based on the IAFA (Internet Anonymous FTP Archives) metadata schema that was developed for Archie . As noted above, the LSM metadata schema has gone through a series of revisions that were initiated and overseen mainly by Jeff Kopmanis, with input from members of the Linux community, and it is now in its third revision.

LSM メタデータのテンプレートによると、LSM は 14つの要素から成り立ち、そのうち以下の 5つは強制である。LSM を作るための情報は、 http://metalab.unc.edu/pub/Linux/docs/linux-software-map/lsm-templateにある。

LSM generation permits the authors to record their expert knowledge about the resource that has been created, rather than a second hand representation, which is practiced with many other metadata schemas in the networked environment. When a contributor submits software to the MetaLab Linux Archives, he places the software and an associated LSM into ftp://metalab.unc.edu/incoming/Linux/ This area is inspected daily by the Archives maintainers using a program called keeper which was written by Eric Raymond then modified by Miles Efron. The Linux Archivist using keeper reviews the LSM information and places the software and LSM in their correct home in the Archive. LSMs help the archivist replace older obsoleted versions of software by use of standard names and version numbers. The LSM is then forwarded to the LSM maintainer for inclusion in the definitive LSM list at execpc.com. The LSM list at execpc.com is regularly mirrored by major Linux sites worldwide including MetaLab (see note 5).

LSM を作ることで作者は、作られた資源についての専門知識を記録することができ、 それは第三者による説明というよりは、ネットワーク環境のたくさんある他のメタデータのスキーマを元に成熟したものである。 共同開発者がソフトウェアを MetaLab Linux アーカイブに登録するとき、 ソフトウェアとそれに関連した LSM を、 ftp://metalab.unc.edu/incoming/Linux/に置く。 この場所は毎日、Eric Raymond の書いた keeper というプログラムを用いて、 アーカイブの管理者によって調べられている。 Linux アーカイブの責任者は keeper を用いて、LSM の情報を確認し、 ソフトウェアと LSM をアーカイブ内の正しい場所に移動させる。 標準名(standard name)とバージョン番号を用いることで、 LSM は、古く期限切れしたバージョンのソフトウェアを移動する手助けとなっている。 LSM は、execpc.com の最終的な LSM リストに含められるため、 LSM の管理者に転送される。 execpc.com の LSM リストは、MetaLab を含む世界中の主な Linux サイトを常にミラーしている。

Many, but not all by any means, contributors of Linux software use LSMs as their means of describing their software as they send announcements to comp.os.linux.announce and other newsgroups. Several LSM searches assist users and developers in finding software including:

全てではないが、数多くの Linux ソフトウェアの共同開発者は、LSM をそのソフトウェアの詳細を記述し、 comp.os.linux.announceや他のニュースグループでアナウンスするのに用いている。 幾つかの LSM 検索エンジン(searcher) は、利用者や開発者が以下のサイトに含まれたソフトウェアを検索する手助けとなる。

 


Profiles of the ML Linux Archives and LSM-Based Contributors

In this section we present data sets and analysis designed to provide selected quantitative characterizations of the open source contribution process as reflected in the ML Linux Archives. The data presented is derived from server-side programs that (1) summarize

filesystem statistics of the repository, (2) analyze the contents of the over 4,500 LSM files found in the ML Archives, and (3) monitored and recorded content changes over a month-long period. For the data reported on LSM content, the number of LSM files varies across statistics since some LSMs contain missing or unusable (e.g., a date field as "Thursday") metadata information in some of their fields.

●MetaLab LinuxアーカイブとLSM(Linux Software Map)を基にした共同開発者のプロフィール
この章ではデータセットと 定量分析を行う。
MLアーカイブから<オープンソース貢献プロセス>を分析。
サーバサイドプログラムから以下を計測:
1)ファイルシステム容量統計
2)MLアーカイブ内の4500以上のLSMファイル内容の分析
3)モニター&記録した内容 月単位の変化
LSMは欠けているあるいは使えないメタデータを含むことがあるため、LSMの数は統計によって異なる。

Role of the ML Archives in Linux Community

Since MetaLab mirrors most other popular Linux archives including most distributions, MetaLab constitutes a superset of most archives and includes most, if not all, current LSM documented software. Evidence of the central role of the ML Linux Archives can be found by examining the Primary-Site field in LSMs. This field allows authors to specify the primary Internet server (and path on that server) on which their Linux contribution resides. As seen in Figure 1, 58% of all LSMs list metalab.unc.edu (or, the

older domain name, sunsite.unc.edu) as the primary repository site, and the next most popular sites appear in 3% or less of the LSMs. This statistic may be biased by the fact that the ML Archives require an LSM with each submission whereas other repositories may not.

●Linuxコミュニティ内のMetaLabアーカイブの役割
MetaLabが、普及しているLinuxアーカイブをミラーしてから、 MetaLabはほとんどのアーカイブのスーパーセットと呼ばれるサブセットの集合体(redhat.comやkarnet.org) を構成し、全てではないとはいえ、LSMドキュメント化された既存のソフトウェアを含むようになった。
ML Linuxアーカイブが中心的な役割を果たしている証拠は、 LSMのプライマリフィールドを調べることによってわかる。
そのフィールドによって、作者は共同開発するプライマリサーバを特定する。
図1:
・LSMリストの58%が MetaLab(第一レポジトリ)で次にポピュラーなレポジトリのLSMは3%にすぎない。
(注:MetaLabはそれぞれ個別にLSMを要求しているから。他ではそこまで要求していない)

Characteristics of the Content in the ML Linux Archives

Table 1 provides summary statistics on the six top-level subdirectories in the ML Linux Archives with the most LSM metadata files. This summary was taken on September 21, 1999. At this time, the ML Linux Archives had a total file count of 129,109 files with 4633 LSMs. However, most of these files (94, 401) are located in the distributions subdirectory of the archive where only 104 of the LSM files are found. LSM contributions may find their way into individual distributions of Linux, although this study does not investigate the extent to which this occurs. The distributions generally are using the Redhat Package Manager (over one-third of files under the distributions subdirectory have the extension .rpm) or other archiving tools to encapsulate related files and their metadata. Another 14,075 files are under the docs subdirectory, where only 23 LSMs were located since LSMs are oriented towards metadata for software contributions.

 

Top-level directory in /pub/Linux on MetaLab

Number of LSMs

Total Number

of Files and Bytes

Number of

.tar.gz or .tgz Files

apps

1312

3904 files (994 MB)

1382

system

1301

3865 (391MB)

1555

X11

397

2495 (567MB)

1039

utils

373

1670 (218 MB)

579

games

297

896 (130 MB)

356

devel

288

1433 (1.3 GB)

487

Table 1: Six Subdirectories in ML Linux Archives Containing the Most LSMs

Excluding the distributions and docs subdirectories, there are 4455 LSMs covering the 20,633 files in the remaining portion of the ML Linux Archives. Table 1 shows the top six subdirectories in terms of number of LSMs. It also presents the total number of files ending in .tar.gz or .tgz to indicate the high density of compressed file archives of this form, the most common format for submission of software source code.

●Linix MLアーカイブ内容の性質
表1:1999年9月21日現在のLinix MLアーカイブの上位6つのサブディレクトリとLSMメタデータファイル
(合計ファイル数:129109 LSM数:4633)
・94401のファイルは "distribution" ディレクトリのものだが、ここにはLSMは104しかない。
 →LSM共同開発者は個人的な配布に流れた
・配布は通常RedHatパッケージマネージャを利用している。(1/3以上のファイルが.rpm拡張子を持つ)
・14075のファイルは"doc"におかれている。ここにはLSMは23しかない。
distributionとdocを以外には、LSMは4455あり、20,633ものファイルをカバーしている。
表1はLSMの数順に上位6つのサブディレクトリを並べている。
tar.gz/.tgzの数が多いことから、圧縮されたファイルアーカイブが、ソフトウェアのコードを 提供するために一般的だということがわかる。

Profile of LSM-Accompanied Contributions

As noted earlier, the ML Archives require the Linux Software Map metadata file to accompany contributions sent to the ML Linux Archives. Figure 2 breaks down the LSMs in the ML Linux Archives by year for the LSM files that included full date information. In interpreting this graph, it is important to remember that the policy of the MetaLab archive has been to replace old LSMs when a new version of a software package arrives. Thus, this data is not an accurate longitudinal study of how many contributions have been made in which years. Rather, it shows that portions of the existing archive extend back to 1993, but many of the contributions have been added or updated in the recent past, e.g., almost one-fourth of the LSMs are additions or changes during the first 6 months of the 1999 year.

The LSM files also contain a field for including an author's email information. Figures 3 and 4 give a breakdown of this information by email suffix. The data shows that Linux Application Contributors indeed come from both the commercial and the educational world. Moreover, while com, edu, and net are difficult to accurately associate with geographical information, the demographics of contributors reveals a strikingly strong

European influence within the Linux community. To clarify, Figure 4 presents the same data but with all suffixes representing European countries aggregated. Note that Figure 4 underrepresents European participation in Linux development since some authors with .com email suffixes are presumably located in Europe.

A separate question of interest is how often Linux developers contribute to open-source software. We extracted a frequency count of authors' last names from the LSM files that contain author data and present this information in Figure 5. As seen there, the vast majority of LSM authors have contributed only one or two items, with only a very small number of developers having produced five or more contributions. Only thirteen contributors have ten or more contributions to their credit. This data then speaks to the breadth of the Linux developer community: as seen in the data for Application Contributors, the open-source development effort has not been dominated by a few very prolific developers, but rather, over time, many participants adding isolated contributions.

●LSM-Accompanied 共同開発者の属性
 ML Linux アーカイブはLSMの形式を定めている。
図2:年別のLinuxアーカイブ内のLSM数 (注:MetaLabの方針により、新しいバージョンのパッケージができると古いLSMはリプレースするので 厳密には年別のLSM数を計れない)
ただし、近年の方が活発だという傾向はわかる。(LSMの1/4は1999年上半期にできている)
図3・図4:LSMに含まれている著者の電子メールアドレスからネットワーク的所属について (注:.comと行っても地理的にはヨーロッパにある可能性もある)
・商業、教育分野からのコントリビュートが非常に多い。
・ヨーロッパ圏の影響が強い
図5:作者の姓から判断した人数について
・ほとんどの作者は1〜2のファイルしか貢献していない。
・5以上のファイルに貢献しているのはほんの少し(10以上の貢献はわずか13人)
 →Linux Developerコミュニティの幅の広さ
 数人の大きな貢献 ではなく 多くの参加者がパーツごとに貢献

Studying the ML Linux Repository Dynamics

As suggested in the data of Figure 2, the ML Linux Archives is an active repository where contributors continue to submit new and updated materials on a daily basis. To provide a baseline profile of the repository contribution process, specifically that driven by the Application Contributors, a repository monitoring experiment was undertaken.

The experiment took the form of a local mirror that gathered change information from a portion of the ML Linux Archives on a twice-daily basis. Due to resource limitations, we restricted our observations to an 8-gigabyte subset of the ML Linux Archives, specifically the six subdirectories under /pub/Linux with the most LSM files (see Table 1) as well as the docs subdirectory. These directories then represent important areas where Application Contributors send LSM-accompanied software and documentation. The mirror script for the experiment ran twice a day, at 8:30 a.m. and 8:30 p.m., to synchronize with the source directories on metalab.unc.edu. Full details of the mirroring experiment are described in .

Figure 6 shows the rate of activity seen in our month-long monitoring experiment. As seen here, the Archives receive constant traffic from open source contributors updating existing materials and adding new items. At times, the process is very bursty, most probably due to external events such as a major release of new software as well as occasional update backlogs when MetaLab staff are off-line over holidays.

More significantly, Figure 7 shows that about one-third of all activity observed in this month-long period resulted from changes to existing files in the repository, e.g., new releases of existing software utilities, whereas about two-thirds represents the addition of new files to the repository. Figure 8 breaks out this activity by some common file types. We note that about 1.5% (59) of the LSMs in the Archives were updated in this month while over 4% (179) of the total were added in this month. In line with these changes then, many of the changes are seen to involve compressed archives using the .gz compression; in fact, over one-half of activity represents new or updated .gz files as software packages are added and changed. (Note that the standard practice at MetaLab has been to remove old files when new versions of open source software or documentation is submitted. The data in the figures does not track file deletions as a separate operation in the update process.)

While our data is not conclusive, the data in Figures 7 and 8 corroborate that in Figure 2 to suggest that the ML Linux Archives is vibrant and contains little stale or outdated materials as a percentage of the entire collection. An interesting follow-on study would be to connect our baseline numbers directly with the question of how often do Application Contributors update (or, alternatively, abandon) their contributions after

creating them? Definitive information on this aspect of open source contribution would speak to the robustness of the open-source process over time and the extent to which the community is able to carry forward the work of other contributors from the past.

●Linux ML レポジトリのダイナミクス
ML Linux アーカイブは動的なレポジトリ→一日単位で更新・新規サブミットができる
レポジトリをモニターすることでどのようなプロセスがされているかを計測。
実験:metalab.unc.edu 内のローカルなミラーで MLアーカイブの変化を測定(1日2回 8:30a.m. と 8:30 p.m.)。
(注:容量制限のため、8GBに絞った。/pub/Linux/以下の主なLSMファイル<表1参照>とdocsディレクトリが対象)

図6:1ヶ月分のアクティビティの割合(新規サブミットと更新)
図7:1/3はファイルの書き換えや更新(例:既にあるソフトウェアのユーティリティのリリース)
  2/3は新しいファイルの追加
図8:ファイルタイプによる分類 全LSMの1.5%がこの1ヶ月に更新(4%がこの1ヶ月で加えられた)
   多くの更新は圧縮されたファイルになされている。1/2は.gzファイルの更新。

図7と8は図2で言われていた ML Linux アーカイブが新鮮で、使えない古いファイルは1%にすぎないことを 裏付ける。 今後の関心は、「どのくらいの頻度で共同開発者たちが自分が作ったファイルを更新するのか」を調べること。 この側面からの、オープンソースの共同制作に関する情報は限られている。しかし、過去の共同制作者の作業にまで 範囲を広げることができるオープンソースの過程が持つ力を証明するものである。

Conclusion

This article reports on quantitative summaries of the large repository of Linux-related materials found in the MetaLab Linux Archives, one of the oldest continuous repositories for Linux materials. User-generated metadata files in a format known as the Linux Software Map (LSM) are required when submitting open source software for inclusion in the MetaLab Linux Archives. Our study examined information inside the over 4500 LSMs, along with longitudinal collection statistics from the MetaLab filesystem, in order to extract a quantitative profile of the large group of Linux developers represented there, a group we have called Application Contributors in the Linux community.

このレポートは、Linuxに関連するソースの巨大な集積が Metalab Linux Archivesにある 巨大なレポジトリの定量的な分析について報告するものである。

LinuxSoftwareMap(LSM)の中にあるユーザーによってもたらされたメタデータが オープンソースソフトをMetalabLinuxArchivesに提出する時には必要である。

この研究ではLSMの中にある4500以上の情報を観察し、 巨大なLinux開発者グループに相当する定量データ(quantitive profile)を抽出するために (縦の)集合統計をとった。

そのグループを「Linuxコミュニティにおけるアプリケーション開発者」、と呼んだ

Our results confirm a very broad participation at this level in the open source software associated with the Linux Archives. A strong bias towards European developers is revealed, reflecting the European roots of Linux perhaps, as well as a balance between .com and .edu contributors. Date information in LSMs and our month-long monitoring experiment reveal a very active repository where users submit many changes to existing files as well as adding new files. This phenomenon along with other questions raised by our baseline study warrant further investigation to develop a fuller understanding of the dynamics of large-scale cooperation over time, as exhibited in the Linux open-source development effort. Such work will shed light on what aspects of the Linux effort can be taken to be representative in determining the viability and robustness of large-scale open-source development projects in the future.

このレベル(アプリケーションレベル)の広い参加オープンソースソフトがLinuxArchivesと大変強く 結びついていることを裏付けた。 comとeduの貢献者の間のバランスと同様に、ヨーロッパのLinuxの起源を反映した ヨーロッパの開発者に対する強い先入観が見うけられるようだ。 LSMの日付情報と月単位に生成されたログ観察から、 ファイルを追加するのと同様に、既にあるファイルを沢山変更するユーザーのいる場所では 非常に積極的な集積が観察された。 Linuxオープンソース開発の成果が示しているこの現象は、 時間を超えて広い範囲で共同作業を行うことに対する理解の一助となる。
このような作業はLinuxの効果が 将来の巨大な規模のオープンソース開発プロジェクトの力と実行可能性 を確実であることを明示している。

References

 

Appendix A

The Open Source Definition, Version 1.7

(reproduced from http://opensource.org/osd.html)

Open source doesn't just mean access to the source code. The distribution terms of open-source software must comply with the following criteria:

「オープンソース」とは、単にソースコードが入手できるということ だけを意味するのではありません。「オープンソース」である プログラムの配布条件は以下の基準を満たしていなければなりません。

1. Free Redistribution

The license may not restrict any party from selling or giving away the software as a component of an aggregate software distribution containing programs from several different sources. The license may not require a royalty or other fee for such sale. (rationale)

1. 自由な再配布Free Redistribution

「オープンソース」であるライセンス(以下「ライセンス」と略)は、 出自の様々なプログラムを集めたソフトウェア配布パッケージ (ディストリビューション)の一部として、ソフトウェアを販売あるいは 無料で配布することを制限してはなりません。 ライセンスは、このような販売に関して印税その他の報酬を要求しては なりません。

2. Source Code

The program must include source code, and must allow distribution in source code as well as compiled form. Where some form of a product is not distributed with source code, there must be a well-publicized means of obtaining the source code for no more than a reasonable reproduction cost -- preferably, downloading via the Internet without charge. The source code must be the preferred form in which a programmer would modify the program. Deliberately obfuscated source code is not allowed. Intermediate forms such as the output of a preprocessor or translator are not allowed. (rationale)

2. ソースコード

「オープンソース」であるプログラムはソースコードを含んでいなければ ならず、コンパイル済形式と同様にソースコードでの配布も許可されて いなければいけません。何らかの事情でソースコードと共に配布できない 場合には、ソースコードを、複製に要するコストとして妥当な額程度の 費用で入手できる方法を用意し、それをはっきりと公表しなければ なりません。方法として好ましいのはインターネットを通じての 無料ダウンロードです。 ソースコードは、プログラマがプログラムを変更しやすい 形態でなければなりません。意図的にソースコードを分かりにくくする ことは許されません。プリプロセッサや変換プログラムの出力のような 中間形式は認められません。

3. Derived Works

The license must allow modifications and derived works, and must allow them to be distributed under the same terms as the license of the original software. (rationale)

3. 派生ソフトウェア

ライセンスは、ソフトウェアの変更と派生ソフトウェアの作成、 並びに 派生ソフトウェアを元のソフトウェアと同じライセンスの下で配布することを許可しなければなりません。

4. Integrity of The Author's Source Code.

The license may restrict source-code from being distributed in modified form only if the license allows the distribution of "patch files" with the source code for the purpose of modifying the program at build time. The license must explicitly permit distribution of software built from modified source code. The license may require derived works to carry a different name or version number from the original software. (rationale)

4. 作者のソースコードの完全な状態

構築の際プログラムを変更するために、ソースコードと一緒に パッチファイルを配布することを認める場合に限って、 ライセンスは変更されたソースコードの配布を制限できます。 ライセンスは変更されたソースコードから構築されたソフトウェアの 配布を明確に許可していなければなりません。 ライセンスで派生ソフトウェアに元のソフトウェアとは異なる名前や バージョン番号をつけるよう義務づけることは許されます。

5. No Discrimination Against Persons or Groups.

The license must not discriminate against any person or group of persons. (rationale)

5. 人やグループによって差別してはならない

ライセンスは特定の個人やグループを差別してはなりません。

6. No Discrimination Against Fields of Endeavor.

The license must not restrict anyone from making use of the program in a specific field of endeavor. For example, it may not restrict the program from being used in a business, or from being used for genetic research. (rationale)

6. 使用する分野で差別してはならない

ライセンスはある特定の分野でプログラムを使うことを制限しては なりません。例えば、プログラムの商用目的での使用や、 遺伝子研究の分野での使用を制限したりしてはなりません。

7. Distribution of License.

The rights attached to the program must apply to all to whom the program is redistributed without the need for execution of an additional license by those parties. (rationale)

7. ライセンスの分散

プログラムに付随する権利は、関係者が配布に当たって追加した条件を 満たさなくても、そのプログラムが再配布された者全てに適用されなければ なりません。

8. License Must Not Be Specific to a Product.

The rights attached to the program must not depend on the program's being part of a particular software distribution. If the program is extracted from that distribution and used or distributed within the terms of the program's license, all parties to whom the program is redistributed should have the same rights as those that are granted in conjunction with the original software distribution. (rationale)

8. ライセンスは特定の製品においてのみ適用されるものであってはならない

プログラムに付与された権利は、ある特定のソフトウェア配布パッケージの 一部であるということに依存するものであってはなりません。 プログラムをそのパッケージから取り出したとしても、そのプログラム 自身のライセンスの範囲内で使用あるいは配布されるのであれば、 プログラムが再配布されるすべての人々は元のソフトウェア 配布パッケージにおいて与えられていた権利と同等の権利を有します。

9. License Must Not Contaminate Other Software.

The license must not place restrictions on other software that is distributed along with the licensed software. For example, the license must not insist that all other programs distributed on the same medium must be open-source software. (rationale)

9. ライセンスは他のソフトウェアのライセンスに干渉してはならない

ライセンスはそのソフトウェアと共に配布される他のソフトウェアに制限を 設けてはなりません。例えば、ライセンスは同じ媒体で配布される他の プログラムが全てオープンソースソフトウェアであることを要求しては なりません。

Conformance

(This section is not part of the Open Source Definition.)

We think the Open Source Definition captures what the great majority of the software community originally meant, and still mean, by the term "Open Source". However, the term has become widely used and its meaning has lost some precision. The OSI Certified mark is OSI's way of certifying that the license under which the software is distributed conforms to the OSD; the generic term "Open Source" cannot provide that assurance, but we still encourage use of the term "Open Source" to mean conformance to the OSD. For information about the OSI Certified mark, and for a list of licenses that OSI has approved as conforming to the OSD, see this page.

 

準拠について

(この節は「オープンソースの定義」の一部ではありません)

私たちはこの「オープンソースの定義」が、ソフトウェア 界の人々の大多数が「オープンソース」という語に元々 込めていた、そして依然込めている意味を捉えていると思っていますが、 この語が広く使われるようになるにつれて、その意味する ところがいくぶん正確さを失っている感は否めません。 そこで OSI は、ソフトウェアの配布に適用されるライセンスが OSD に準拠していることをOSI 認定マーク で証明することにしています。 私たちは「オープンソース」という用語を OSD に準拠しているという 意味で使うことを推奨していますが、 総称的用語としての「オープンソース」には何の保障もありません。 OSI 認定マークについての情報、そして OSI が OSD に準拠していると認めたライセンスのリストについては 認定マークについてを ご参照下さい。

Bruce Perens wrote the first draft of this document as `The Debian Free Software Guidelines', and refined it using the comments of the Debian developers in a month-long e-mail conference in June, 1997. He removed the Debian-specific references from the document to create the `Open Source Definition'.

 

Bruce Perens がDebian フリーソフトウェアガイドライン としてこの文書の最初の草稿を書きました。その後彼は、 Debian の開発者陣が 1997 年 6 月に行った、1ヵ月にも及ぶ電子 メールによる討議において寄せられた意見を 採り入れて推敲し、 Debian 固有の話題を文書から削除して、この 「オープンソースの定義(The Open Source Definition)」を 書き上げました。

Appendix B

Annotated Linux Software Map Template

LSMの注釈テンプレート

(excerpted from http://metalab.unc.edu/pub/Linux/docs/linux-software-map/lsm-template)

Begin3

Title: The name of the package. Please use the same title for the LSM entry of each version, so as to make it easier to find entries for new versions of packages that already have one in the data base.

タイトル:パッケージの名前。LSMに既に存在する各バージョンと同じ名前を使ってください。 既にデータベースに存在するパッケージの新しいバージョンを検索するのが容易にするために。

Version: Version number or other designation. Use a date if nothing else is appropriate.

バージョン:バージョン番号か他の名称について。適切なものがなければ日付を使ってください。

Entered-date: Date in format ddMMMyy of when the LSM entry was last modified, where dd is 2-digit day of month, MMM is ALL-CAPITALIZED first 3 English month letters, and yy is last two digits of the year in the Gregorian calendar. Note that you should fill in both Version and Entered-date.

日付の入れ方:LSMのエントリーを最新のものに更新する時は「ddMMMyy」というフォーマットを使ってください。 ddはその月の日付を2文字で、MMMは「全て大文字の」3文字のその月を英語で、YYは西暦の下二桁を示します。 バージョンと加えた日付の両方記述するように注意してください。

Description: Short description of the package.

説明書き:そのパッケージの短い説明

Keywords: A short list of carefully selected keywords that describe

the package.

キーワード:そのパッケージを表す適切なキーワード

Author: Original author(s) of package. In RFC822 format (i.e., something that will fit into a From: or To: header of anormal Internet mail message). Preferred format:

mailname@site.domain.top (Full name)

Other formats will be converted to this format, if time and energy of LSM maintainer will allow it. Multiple persons may be given, one per line.

作者:そのパッケージのオリジナルの作者。RFC822の体裁(すなわち、インターネットのメールにおける From:やTo:ヘッダ)に整ったもの。好まれるのは mailnaime@side.domain.top(本名) LSM管理者の時間と精力が許す限りこれ以外のフォーマットはこのフォーマットに変換される。 複数人いるときは1行に一人を書くように。

Maintained-by: Maintainer(s) of Linux port. Same format as Author.

メンテナンス:執筆者と同じフォーマットで。

Primary-site: A specification of on which site, in which directory, and which files are part of the package. First line gives site and base directory, the rest give the sizes and names of all files. Names are either relative to the base directory, or full pathnames. If the ftp site does not use Unix style pathname syntax, then the full pathname must be given every time. The pathname must not contain spaces. Example:

第一(プライマリ)サイト:どのサイトのどのディレクトリにパッケージのどの部分があるかを記す。 1行目にはサイトとベースディレクトリ ファイルの名前と大きさとベースディレクトリとフルパスの名前。 もし、ftpサイトがUnixのパスネームを使っていなければ、例外なくフルパス名を与えければならない。 パス名はスペースを含まないようにしなければならない。例えば

Primary-site: sunsite.unc.edu /pub/Linux/docs

10kB lsm-1994.01.01.tar.gz

997 lsm-template

22 M /pub/Linux/util/lsm-util.tar.gz

The file size may be given in bytes (no suffix), kilobytes (k, kb), or megabytes (M, MB). The suffix may be separated with spaces, and may be in upper case or lower case. The size can be left off.

For very large packages that are contained within one directory (say, a distribution), only the directory need be listed. Adding a trailing slash makes it clear that it is a directory.

The filename should be the final location, not an "incoming" directory. If you don't know the final location, at least make a good guess (since files _will_ be moved from incoming, it is not a good guess).

ファイルの大きさはバイト(サフィックスではない)、キロバイト、メガバイト サフィックスはスペースでよく区切られており、しばしば大きすぎたり小さすぎたりする。 そのサイズは破棄される。 1つのディレクトリの中にある非常に大きなパッケージ(ディストリビューションと言おう) には、ディレクトリのリストのみ入れれば良い。ディレクトリと分かるように、 スラッシュマークをつけること。 最終的な場所を指すファイル名は、incomingディレクトリに入っていないように。 もしも最終的な場所がわからなければ、少なくとも推察するように(incomingのファイルは移動されるので incomingを含めるのは良い推察ではない)

Alternate-site: One alternate site may be given. It should not be a site that mirrors the primary site (these are best found from a list of mirror sites), but should be one that maintained separately. More sites carrying the package can be found using Archie. The syntax is the same as for Primary-site, but if there is only one line (i.e., no files are specified), they are assumed to be the same as for Primary-site.

Alternate-site: ftp.funet.fi /pub/OS/Linux/doc/lsm

Alternate-site: foo.bar /pub/lsm

11 kB lsm-1994-01-01.cpio.Z

0.1 kB lsm-template.Z

22 MB lsm-util.tar.gz

第二サイト:代替サイトを登録する。プライマリサイトのミラーとしてセカンダリサイトを登録するわけではない。 ミラーサイトのリストからみつけられるのが最も良い)しかし、プライマリサイトとは独立して 運用される。他のパッケージを見つけるためのサイトはArchieを使うことで見つけれられる。 構文はプライマリサイトと同じであるが、もし1行(つまり何もファイルがとくに無い状態)でなければ 記述はプライマリサイトのものに順ずる。

Original-site: The original package, if this is a port to Linux. Syntax is as in Primary-site, with the same handling of missing filenames as in Alternate-site.

オリジナルサイト:Linuxへ移植されたものであれば、そのオリジナルのパッケージを記す。 構文はプライマリサイトと同じもの。互いのサイトにかけているファイル、を入れる。

Platforms: Software or hardware that is required, if unusual. A C compiler or floppy disk would not be unusual, but a Python interpreter or tape drive probably would be. If the requirements are evident from the description, it need not be repeated here.

プラットフォーム:もし、特別に要求されるソフトウエア、あるいはハードウェアがあれば記述する。 Cコンパイラやフロッピーディスクは特別なものではないが、Pythonやテープアーカイブは特別なものである。 もし要求されるものが記述の中に明らかであれば、特にここで繰り返す必要は無い。

Copying-policy: Copying policy. Use "GPL" for GNU Public License, "BSD" for the Berkeley style of copyright, "Shareware" for shareware, and some other description for other styles of copyrights. If the use or copying requires payment, it must be indicated.

コピーポリシー:GNU パブリックライセンスのGPL なのか、バークレイの著作権方式であるBSDなのか。 シェアウエアなのか、著作権に関する他の何か特別な記述があるか。もしコピーに何か 支払いが求められる場合は、きちんと示す必要がある。

End

 

Endnotes:

1. See http://metalab.unc.edu/osrt/ for related work by the Open Source Research Team. (Back)

2. It is interesting to note that the GNU Emacs FAQ (http://www.gnu.org/software/emacs/emacs-faq.text) dated February 1999 points out: "The real legal meaning of the GNU General Public License (copyleft) will only be known if and when a judge rules on its validity and scope. There has never been a copyright infringement case involving the GPL to set any precedents." (Back)

3. Personal correspondence, Jeff Kopmanis, August 1999. (Back)

4. http://MetaLab.unc.edu/pub/linux/docs/LSM/LSM.README (Back)

5. The numbers of active LSMs in the MetaLab archive actually outnumber those in the official LSM listing maintained by Aaron Schrab by about 500 entries in September 1999. (Back)