1. ホーム
  2. json

[解決済み] TTLファイルフォーマット - これが何なのかさっぱり分からない

2022-02-08 13:43:59

質問

構造体を持つファイルがあるのですが、どのような形式なのか、どのようにパースすればいいのかわかりません。ファイルの拡張子はttlですが、今まで一度も遭遇したことがありません。

ファイルの一部の行は次のようになります。

<http://data.europa.eu/esco/label/790ff9ed-c43b-435c-b6b3-6a4a6e8e8326>
    a                   skosxl:Label ;
    skosxl:literalForm  "gérer des opérations d’allègement"@fr .

<http://data.europa.eu/esco/label/98570af6-b237-4cdd-b555-98fe3de26ef8>
    a                   skosxl:Label ;
    esco:hasLabelRole   <http://data.europa.eu/esco/label-role/neutral> , <http://data.europa.eu/esco/label-role/male> , <http://data.europa.eu/esco/label-role/female> ;
    skosxl:literalForm  "particleboard machine technician"@en .

<http://data.europa.eu/esco/label/aaac5531-fc8d-40d5-bfb8-fc9ba741ac21>
    a                   skosxl:Label ;
    esco:hasLabelRole   "http://data.europa.eu/esco/label-role/female" , "http://data.europa.eu/esco/label-role/standard-female" ;
    skosxl:literalForm  "pracovnice denní péče o děti"@cs .

そして、このような状態が400MB以上続くのです。すべてのノードではありませんが、いくつかのノードで追加の属性が追加されています。

XMLのような形式を思い浮かべますが、さまざまな形式を扱った経験はあまりありません。また、グラフとしてモデル化できるようなものにも見えます。 どのようなデータ形式なのか、また、Pythonでどのようにパースできるのか、お分かりになりますか?

どのように解決するのですか?

はい、@Phil の言う通り、これは RDF データを格納するためのタートル構文です。

400MB以上のファイルを自分で解析するよりも、ある種のRDFストアにインポートすることをお勧めします。次のような方法があります。 グラフDB , ブレイズグラフ , ヴィルトゥオーソ などなど、数え上げればきりがありません。RDFストアで検索すれば、他にも多くの選択肢があるはずです。

次に SPARQL を使ってRDFストアに問い合わせることができます(リレーショナルデータベースのSQLのようなものです)。 RDFlib . 以下は をRDFLibから取得しました。