EML の単位

EML(Ecological Metadata Language) は 生態学データに特化した規格であるとされているが、 色々と不足がある。中でも、標準で用意されている数値データの物理量の単位が 網羅的でなく、使いたい単位が無い場合も多い。 そういう場合は custom unit を定義して、その定義を EML メタデータに 個々に追加する必要がある。

今回問題となったのは、光合成の研究で使われる光子量の単位で、 例えば μmol photons m-2 s-1 である。 光合成量は光子のエネルギー量ではなくて光子の個数によって決まるため、 ジュール(J)等ではなくて物質量(mol) の単位を使う。 なお、光子 の mol 数を表す単位としてアインシュタイン(E)がある (ということを今回初めて知った)。 従って μmol photons m-2 s-1 は μE m-2 s-1 でもほぼ等価である。

さて、光合成の研究などは世界各地でうんざりするほど実施されている訳で、 そのデータ用の EML メタデータも既に作成されている筈である。 Google で検索してみたところ、早速 2,3 個ヒットした。

Harvard Forest Research の knb-lter-hfr.140.9

<stmml:unit
    name="micromolePerMeterSquaredPerSecond"
    unitType="arealMassDensityRate"
    id="micromolePerMeterSquaredPerSecond"
    parentSI="molePerMeterSquaredPerSecond"
    multiplierToSI="0.000001"
    constantToSI="0.0"
    />

シカゴ大 Marine Biological Lab. の knb-lter-pie.92.3

<unit
    name="microEinsteinPerMeterSquaredPerSecond"
    unitType="illuminance"
    id="microEinsteinPerMeterSquaredPerSecond"
    parentSI="" multiplierToSI="1">

ミネソタ州立大 McMurdo Dry Valleys の knb-lter-mcm.3001.34

<stmml:unit
    id="umolphotons/m2/second"
    name="umolphotons/m2/second"
    abbreviation=""
    unitType="">

フロリダ国際大 FCE サイトの 単位リスト

microEinsteinsPerSquareMeterPerSecond
illuminance
µE/m^2/s
Einsteins (1E-06 moles of photons) per square meter per second (radiant flux density)

定義が 4者4様で興味深いが、どれも間違いがあるのは頂けない。

HFR と MBL はそれぞれ "micromole..." "microEinstein..." としているが、 s を入れて "micromoles..." "microEinsteins..." とするべきだ。

MCM の "umolphotons/m2/second" は STMML 書式ですらない (<stmml:unit> というタグを使用しているのに)。

MCM と FCE は単位のカテゴリを illuminance としているが、 illuminance(照度)は心理物理量で、人間の視覚システムが感じる明るさ、 を意味しており、光子の物理学的なエネルギーや個数とは一意な関係には無い。 また HFR はカテゴリを arealMassDensityRate としているが、 mass は質量(kg, ton など)のことであり、 mol 数は 物質量(amount of substance)である。

EML は custom unit という名目で自由に単位を追加することができるが、 反面、それを正しく使うのにはそれなりの知識が必要で、 正確に記述できるかどうかは担当者の力量に強く依存する。 人間がメタデータを読む分には問題は生じないだろうが、 将来的に機械で自動処理させる段になったら困りそうだ。