第16章 ai模型訓練 (第2/2頁)
王卿開始著手準備訓練自己的寫小說AI模型。
為了訓練這個模型,他需要一個足夠大的小說資料集。
“資料集,自然是在網上獲取。”
於是,他開始在各個小說網站上尋找可用的小說資料。
首先被他盯上的,自然是點娘小說網。
他開啟了網站首頁,看到了裡面的分類,點選進去,他發現了分類下有很多小說。
“這個分類下有不知道有多少本小說啊,要是一個個點進去再爬取,肯定會花費很多時間,還是寫一個爬蟲自動化一下吧!”王卿自言自語道。
於是他開始著手寫爬蟲,他開啟了自己的程式碼編輯器,開始寫起了程式碼。
他先寫了一個簡單的爬蟲程式,測試是否能夠爬取小說的標題和作者。
“先牛刀小試一下。”
資訊科技掌握五級,讓王卿看到現在的程式碼,感覺處處都是機會。
但是,未經過實踐過,他也不知道自己掌握的東西是不是井中月水中花。
還是要在電腦上跑一跑,心裡面才有底。
程式執行了幾分鐘後,王卿開啟了生成的資料檔案,看到了裡面的內容,沒有問題,數萬本小說的標題和作者都被寫入了資料庫之中。
↑返回頂部↑