diff --git a/configs/hang/hang_BASE.xml b/configs/hang/hang_BASE.xml new file mode 100644 index 0000000..552d4b1 --- /dev/null +++ b/configs/hang/hang_BASE.xml @@ -0,0 +1,125 @@ + + + + + + + + + + + ELTE-DH webcrawling + + creator + ELTE-DH + + + + project director + PalkóGábor + https://orcid.org/0000-0002-4394-8577 + + + chief programmer + IndigBalázs + https://orcid.org/0000-0001-8090-3661 + + + TEI expert + FellegiZsófia + https://orcid.org/0000-0001-9199-1759 + + + programmer + Sárközi-LindnerZsófia + https://orcid.org/0000-0002-2558-0633 + + + + + ELTE-DH + http://elte-dh.hu/ + + Budapest http://www.geonames.org/3054643 + + 2020 + +

Metadata: IN COPYRIGHT - NON-COMMERCIAL USE PERMITTEDhttp://rightsstatements.org/vocab/InC-NC/1.0/

+

Text: IN COPYRIGHT http://rightsstatements.org/vocab/InC/1.0/ +

+
+ +
+ + + + Alhambra Press Bt. + 1034 Budapest, Szomolnok u. 7. I. em. 3. + + + + + Budapest + http://www.geonames.org/3054643 + +

Minden jog fenntartva © 2018-2021 - Magyar Hang

+

+

+
+ +
+
+
+ + + + + Magyar Hanghttps://hang.hu/ + hun + + In Copyright + + + + + + + WARC/1.1 + + 2021-09-02 19:50:07/2021-09-06 18:31:37 + + + + urn:uuid:5ec17312-d7ee-4f3b-801e-4557ffa4a463 + + + + + + + TEI + + + Palkó Gábor + Indig Balázs + Fellegi Zsófia + Sárközi-Lindner Zsófia + + + + + + TEI file created + +
+ + + + +
diff --git a/configs/hang/hang_notext_tags_normal.tsv b/configs/hang/hang_notext_tags_normal.tsv new file mode 100644 index 0000000..81914aa --- /dev/null +++ b/configs/hang/hang_notext_tags_normal.tsv @@ -0,0 +1,29 @@ +frequency tag average_word_count average_descendant_num immediate_texts_average_length URL_example normal_name preserved_attribute +default

default default default no_example bekezdes default +default

default default default no_example cimsor default +default

default default default no_example cimsor default +default

default default default no_example cimsor default +default

default default default no_example cimsor default +default default default default no_example felkover default +default default default default no_example felkover default +default default default default no_example kiemelt default +default default default default no_example dolt default +default default default default no_example kiemelt default +default default default default no_example alsoindex default +default default default default no_example felsoindex default +default default default default no_example athuzott default +default default default default no_example alahuzott default +default default default default no_example athuzott default +default
    default default default no_example lista default +default
      default default default no_example lista default +default
    1. default default default no_example listaelem default +default default default default no_example table_text default +default default default default no_example sor default +default
      default default default no_example oszlop default +default default default default no_example oszlop default +default default default default no_example idezet default +default
      default default default no_example media_tartalom default +default