EnasKhwaileh
/

TABERTA

https://wikidbs.github.io

Model card Files Files and versions

enas commited on Feb 6

Commit

47c0bd1

·

verified ·

1 Parent(s): 7c7bfa8

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -162,7 +162,7 @@ This is the **default model** used in the paper.
 ## Dataset corpus
 ### **Training TABERTA Corpus**
-TABERTA is fine-tuned on WikiDBs, a large-scale corpus of relational databases automatically extracted from Wikidata, containing over 100K databases and 1.6M tables spanning diverse domains and realistic schema designs. WikiDBs is used only for representation learning—no downstream benchmark queries or relevance labels are observed during training—making the learned embeddings reusable across tasks.
 ### **Experiencing and evaluating Corpus**

 ## Dataset corpus
 ### **Training TABERTA Corpus**
+TABERTA is fine-tuned on WikiDBs, a large-scale corpus of relational databases automatically extracted from Wikidata, containing over 100K databases and 1.6M tables spanning diverse domains and realistic schema designs. WikiDBs is used only for representation learning no downstream benchmark queries or relevance labels are observed during training by making the learned embeddings reusable across tasks.
 ### **Experiencing and evaluating Corpus**