Korpus yang dilatihnya, disebut WebText, berisi lebih dari 8 juta dokumen dengan total 40 gigabita teks dari URL yang dibagikan dalam pengiriman Reddit dengan setidaknya 3 suara positif.
Korpus yang dilatihnya, disebut WebText, berisi lebih dari 8 juta dokumen dengan total 40 gigabita teks dari URL yang dibagikan dalam pengiriman Reddit dengan setidaknya 3 suara positif.