Conversation
- taxonomy 必須チェックを追加:taxonomy が必須のデータセットで 未指定時にエラーを出すように修正 - PubDictionaries API 呼び出しに use_ngram_similarity=true パラメータを追加 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
- config_list_targets: 逆向きリンクの表示対応 - execute_query: format="dataframe"パラメータ追加(pandas DataFrame出力対応) - label_converter: label_typesの短縮名マッピング対応(PubDictionaries) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- LabelConverter.convert_pubdictionaries 出力を Web UI 形式に変更 - match_type 列を dataset.yaml の label 値 (Name/Exact synonym 等) に - dictionary 列を削除 - 正規ラベル列を find_terms で取得して追加 (列名は preferred dict の label) - find_terms のパラメータを 'identifiers' に修正 - AnnotationsConverter.execute_query (format='dataframe') の改善 - 取得失敗 ID を NA 行 (list field は空配列) で出力に含める - 入力 ID 順を維持 - TogoIDConverter.convert (annotate) のカラム名をドット区切りに - "ncbigene label" → "ncbigene.label" Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
概要
ユーザーフィードバックに基づき、label2id 機能およびその他の機能修正を実施しました。
変更内容(第2弾)
1. taxonomy 必須チェックの追加
dataset.yamlでlabel_resolver.taxonomyがtrueのデータセットで、taxonomyが未指定の場合にValueErrorを raise するように修正2. PubDictionaries API に
use_ngram_similarity=trueを追加変更内容(第3弾)
3.
config_list_targetsで逆向きリンクを表示src-dst)だけでなく逆向き(dst-src)のリンクも表示するように修正4.
execute_queryにformatパラメータ追加format="dict"(デフォルト、後方互換)とformat="dataframe"(pandas DataFrame 出力)を選択可能に5.
label_converter.convertのlabel_typesマッピング対応label_type値(短縮名、例:"label","exact_synonym")を指定可能にdictionary名(例:"togoid_chebi_label")に自動変換テスト方法
全テストを実行
個別テスト
テスト1: taxonomy 必須チェック
テスト2: PubDictionaries API
テスト3: config_list_targets 逆向きリンク
テスト4: execute_query に format パラメータ
テスト5: label_types の短縮名マッピング
R版の対応
R版も同様の修正を実施しました:
🤖 Generated with Claude Code
Co-Authored-By: Claude Opus 4.6 (1M context) noreply@anthropic.com
第4弾フィードバック対応 (追加コミット 4af8872)
修正点
P-A: PubDictionaries 出力を Web UI と同じ形式に
match_typeをdataset.yamlのlabel値("Name" / "Exact synonym" / "Broad synonym" 等)で表示dictionary列を削除preferred: trueの辞書からfind_termsAPI で正規ラベルを取得して列追加(列名は preferred dict のlabel、例:Name)find_termsのクエリパラメータをids→identifiersに修正(PubDictionaries の正しい仕様)P-B:
AnnotationsConverter.execute_query(format='dataframe')の改善[]、scalar field はNone)P-C:
TogoIDConverter.convert(annotate=...)のカラム名修正"ncbigene label"→"ncbigene.label"(R版と統一、ドット区切り)テスト方法 (第4弾)
python3 test_round4.py # 全項目を一括検証個別の検証コマンド
P-A: PubDictionaries Web UI 形式
P-B: execute_query 欠損 ID
P-C: annotation カラム名
関連 PR