走(そう)るメイトランキングに使用するデータ



◎使用するイベント

過去5年間に開催されたオリエンテーリングの大会・練習会等の成績データを 基本的には全て使用します。 但し、以下の条件を付けています。

大会だけでなく練習会などの成績も使用し、 しかも5年間という長い集計期間にしているのは、 少しでも多くの選手をランキング対象に含めるためです。 例えばまだオリエンテーリングを始めたばかりの方、 最近オリエンテーリングでほとんど見かけなくなってしまった方、 参加者数の少ないクラスに出場することが多く他選手との成績比較が難しい方など、 最近の主要大会のみを使用したのでは実力の評価が難しい選手についても 走(そう)るメイトランキングを使えばおおよその競技レベルを知ることができます (もちろんデータが少ないので誤差は大きくなります)。

◎lapcombat2ファイル

膨大な成績データを処理するにあたり、 成績を人間がいちいち手作業で入力していては大変な時間と労力がかかり、 入力ミスをするリスクも高くなります。

そこでランキング計算のコンピュータプログラムでは lapcombat2ファイルを編集無しでそのまま読み込ませて処理する方式にしています。

lapcombat2ファイルというのはLAP解析に用いられるデータファイルのことです。 LapCenterで「記録一覧/LAP解析」をクリックすると 「LapCombat2用ファイル」というボタンがありますね。 これをクリックするとlapcombat2ファイルを入手できます。



このファイルはlapcombat2というソフトウェアを使わないと 見れないと思っている人もいるかもしれませんが、 中身はただのテキストファイルです。 Windowsの「メモ帳」などで開けば中身を見れます。 そこには例えば次のようなデータが入っています。

(2016/4/24の岡崎市大会のlapcombat2ファイルから一部を抜粋)
<class name="M21A"  length="4200" climb="230"  controls="12" course="1"  filename="1">
<runner name="細川 知希" id="208289"  ecard="208289" club="OLCルーパー"  start="11:03:00" result="0:42:26"  rank="1" sex="m">

上の例で1行目の「<class name="M21A"…>」は 「ここから後がM21Aクラスの成績です」ということを示しています。 「length="4200"」はコース距離が4200mであることを、 「climb="230"」は登距離が230mであることを示しています。 ランキング計算にとって重要なのが「course="1"」という部分で、 この情報からM21Aクラスのコース番号が1であることが分かります。 ランキング計算ではこのコース番号を使ってコース毎に選手間の成績を比較します。 クラス毎に比較するよりも多くの選手を一度に比べられるからです。

2行目の「<runner name="細川 知希"…>」は 「ここから後が細川知希選手の成績です」ということを示しています。 いろいろな情報が書かれていますが、主なものとしては 「start="11:03:00"」がスタート時刻を、 「result="0:42:26"」が競技成績(所要時間)を、 「 rank="1"」が順位を示しています。 ランキング計算に主に使用するのは所要時間です。 スタート時刻は一つのイベントに同じ選手の名前が2度登場する場合に どちらが2度目の出走かを判定するのに使用します。 順位はランキングには使いませんが、 参考記録の判定のために順位をチェックします。 もし「rank="参"」となっていたら参考記録です。


◎名前の誤記の修正

ランキング計算では名前(フルネーム)が完全一致する競技者同士を同一人物と見なします。 このときに問題になるのが
のように、文字列として完全に一致していないと コンピュータを用いた処理では別人物と判断されてしまうことです。

ランキング計算システムではこれらの問題に対処するために 競技者名の自動修正アルゴリズムを用いています。

まず、競技者名の中の空白文字、数字や括弧から後の部分は自動的に削除します。 これにより「久野 桃子」は「久野桃子」に、 「角岡明2本目」や「角岡明(三河)」などは全て「角岡明」に自動修正されます。

次に漢字の間違いや苗字のみの記録への対応ですが、Eカード番号を使用します。 同じ競技者名とEカードの組合せが何度も登場する場合、 その組合せをマイカードと見なします。 そして、マイカードとEカード番号が同じで競技者名が1文字だけ違う記録や、 マイカードの競技者名の後半を省いた競技者名の記録は同一人物と判断します。

例えば、澤田陸選手が日頃同じEカードでしばしば大会に出場している場合、 このEカードが澤田陸選手のマイカードとしてランキング計算システムに登録されます。 そして、仮に「沢田陸」という記録が登場した場合、 Eカード番号が澤田陸選手のマイカードと同じであれば、 この沢田陸なる人物は澤田陸選手の漢字間違いであると判定される仕組みです。

それでは漢字が一字違いの実在する別人物 「澤田潤」が登場したらどうなるかという話ですが、 Eカード番号が違うので同一人物とは判定されません。 運悪く澤田陸選手が澤田潤選手にマイカードを貸した場合は誤判定されてしまいますが、 そういうケースは極めて稀ですし、 仮にそのような誤判定が発生したとしても影響するのはその1レースのみで、 他のレースの澤田潤選手は澤田潤選手のままとなります。

マイカードの競技者名の後半を省いた競技者名についても同様です。 合宿などで「河村」という競技者が登場した場合、 河村優花選手とEカード番号が同じであれば河村優花選手の記録と判定されます。 河村健二さんの記録とはEカード番号が違うことで区別されます。

マイカードの判断基準

使用する5年間のデータの中に同一の競技者名とEカード番号の組合せが5回以上登場するか、 又は5年間のうちの特定の1年間に3回以上登場する場合、 その組合せを「マイカード候補」とします。 但し、同一のイベントに同じ組合せが複数回登場しても1回とカウントします。

あるEカード番号のマイカード候補が5年間にわたって1つしか無い場合、 その候補はマイカードと見なされます。 5年間の中で同じEカード番号のマイカード候補が複数ある場合でも 期間に重複が無ければそれぞれの登場する期間のマイカードと見なします。

同じEカード番号で競技者名の異なるマイカード候補同士で期間に重複がある場合は どちらもマイカードとは見なされません。 ただしこれには2つ例外があります。
なおlapcombat2ファイルでは競技者名のどこまでが姓でどこからが名なのかは 分かりませんので、後半の省略や最後の一文字の一致をもって同一人物と判断します。

マイカードの判断基準:例

Eカード番号12345の記録が以下の期間・回数登場するケースを考えてみましょう。
競技者名登場回数登場期間
三河一男3回2012/10/6〜2013/2/17
尾張一郎3回2012/10/20〜2013/3/24
地図花子7回2013/4/27〜2016/5/22
愛知次郎1回2014/10/26
折園花子3回2016/3/20〜2016/7/30
折園太郎5回2016/9/3〜2017/7/16
折園3回2016/12/17〜2017/6/11

まず愛知次郎さんについては1度しか登場しませんので そもそも「マイカード候補」になりません。 したがって以降のマイカード判定ではこの記録は無視されます。

残りの6名についてはいずれも1年間に3回以上もしくは5年間で5回以上登場していますので マイカード候補となります。 登場期間を見ると
でそれぞれ期間が重複していますね。 これらは同一人物のマイカードと見なされるでしょうか。

まず地図花子さんと折園花子さんは最後の1文字がいずれも「子」で一致しますので 結婚による改姓と判断されます。 これにより、2013/4/27〜2016/7/30の期間はEカード12345は 折園花子さん(旧姓:地図花子さん)のマイカードであったと見なされます。

折園さんは折園太郎さんの後半を省いた名前になっていますので 姓のみの記録と見なされます。 これにより、2016/9/3〜2017/7/16の期間はEカード12345は 折園太郎さんのマイカードであったと見なされます。 折園花子さんと折園太郎さんでは登場期間に重複がありませんので、 2016/7/31〜2016/9/2の間のいずれかの時期に マイカードの譲渡が行われたと判定されます。

これに対し、三河一男さんと尾張一郎さんは 結婚による改姓にも姓のみの記録にも該当しません。 したがって同一人物とは見なされず、かつ登場期間も重複していますので この時期にはEカード12345はマイカードではなかったと判断されます。 レンタルEカードやクラブで使い回しているEカードなどが たまたま三河一男さんと尾張一郎さんに3回ずつ当たったというようなケースで こういうことが起こりえます。

競技者名登場回数登場期間判定結果
三河一男3回2012/10/6〜2013/2/17 マイカードではない
尾張一郎3回2012/10/20〜2013/3/24 マイカードではない
地図花子7回2013/4/27〜2016/5/22 折園花子(旧姓:地図花子)さんのマイカード
有効期間:2013/4/27〜2016/7/30
折園花子3回2016/3/20〜2016/7/30
折園太郎5回2016/9/3〜2017/7/16 折園太郎さんのマイカード
有効期間:2016/9/3〜2017/7/16
折園3回2016/12/17〜2017/6/11


◎イレギュラーな記録の扱い

以下の記録は解析に使用しません。 これらは完走人数などのカウントにおいても除外します。

一方、次の記録は所要時間を1.2倍した上で解析に用います。
2018年度からは参考記録と2度目以降の出走は解析に含めません。

なお、lapcombat2ファイル内にスタート時刻の与えられている記録と 与えられていない記録の両方がある場合、 スタート時刻の与えられている記録が先と判断します。 これは、スタート時刻の与えられている記録と 与えられていない記録の両方が存在するケースとして 大会と追加練習メニューのような組合せが想定されることを念頭に置いたものです。

いずれの記録もスタート時刻が空欄の場合はどれが2本目か分からないので 「複数回出走」として「2度目以降の出走」とは異なる扱いにします。 複数回出走では1.2倍はせずにもともとの所要時間のまま処理しますが、 あとでポイントを平均をする際に出走回数で割って重みを低くします。

予選決勝方式のイベントでは2度目以降の出走も正規の記録として扱います。 あるイベントが予選決勝方式であるか否かはクラスとイベント名で判断します。
が予選決勝方式と見なされます。


トップページに戻る