top of page
Meklēt

Kā MI palīdz lasīt vecos laikrakstus?

  • 5. apr.
  • Lasīts 2 min

Updated: pirms 4 dienām

Jums noteikti ir pazīstama problēma – atrodat kādu interesantu rakstu vēsturiskā laikrakstā, bet tas ir ne tikai vecajā drukā un ortogrāfijā, bet arī vēsturiskā valodā, ar senlaicīgiem izteicieniem. Nav viegli izlasīt, bet MI var palīdzēt.


robots burvis pārvērš vecus laikrakstus

Šim ierakstam par iedvesmu kalpoja kāds jautājums Facebook grupā, kur mans ieteikums izmantot MI tika apšaubīts. Vēlos parādīt, ka mākslīgais intelekts tomēr var būt labs palīgs.


Vietne periodika.lv automātiski piedāvā veco laikrakstu drukātā teksta elektronisko versiju, taču bieži vien šī versija nav daudz vieglāk lasāma – vārdi joprojām ir vecajā ortogrāfijā, un OCR kļūdas ir bieži sastopamas. Zemāk – piemērs.


vēsturisks laikraksts

Bet esmu iemanījusies izmantot MI, lai šo procesu padarītu ērtāku. Te būs mans risinājums soli pa solim:


1. Nokopēju elektronisko tekstu.

Šajā piemērā izmantoju runu, kas teikta biškopības biedrības “Drava” atklāšanā 1898. gada 9. augustā. Jūs jau redzat, ka transkribētais teksts ir pilns ar kļūdām – visbiežāk, piemēram, “w” tiek nolasīts kā “m”. Ja būtu jālabo viss teksts manuāli, tas prasītu daudz laika un pacietības. Turklāt nav viegli uzreiz “piešauties” un pareizi nolasīt, piemēram, “ee” kā “ie” vai saprast, kad “s” būtu jāsaprot kā “z” u.tml.


2. Izmantoju ChatGPT maksas versiju (GPT-4).

Noteikti arī citi MI rīki varētu palīdzēt, bet šobrīd strādāju ar šo. Lūdzu pārrakstīt tekstu mūsdienu ortogrāfijā, nemainot vārdus vai teikumu uzbūvi. Protams, var arī palūgt MI pārrakstīt tekstu mūsdienīgā valodā – ļaujot mainīt vārdus un teikumu struktūru –, bet tad būs grūtāk pamanīt kļūdas vai salīdzināt ar oriģinālu.


Mans uzdevums MI šajā gadījumā bija šāds: "Te ir vēsturiska laikraksta teksta atšifrējums. Dators atpazinis burtus, bet lielu daļu neprecīzi. Uzraksti tekstu mūsdienu otrogrāfijā, bet nemaini vārdsu vai teikumu uzbūvi"


Ievadītais teksts ChatGPT
Ievadītais teksts ChaGPT

3. Pārbaudu rezultātu.

Kad iegūts pirmais variants, to pārbaudu, salīdzinot ar oriģinālu. Kļūdas noteikti var gadīties, kā jau redzams arī piemērā zemāk: "nozīmē" vietā ir "nosīmē", vārdu "zinības" MI tomēr aizvietojis ar "zināšanas" u.c. Tomēr piekritīsiet, ka kopumā teksts ir tiešām labi pārrakstīts.


ChatGPT ģenerētais teksts
ChatGPT pārrakstītais teksts


4. Tālāk var rīkoties pēc vajadzības. Ja teksts ir pārlasīts un precizēts, varu lūgt MI to pārrakstīt mūsdienu valodā (t. nomainīt arī vārdus vai izteicienus un mainīt teikumu uzbūvi), varu lūgt to iztulkot vai veidot kopsavilkumu – atkarībā no vajadzības konkrētajā gadījumā.

Tagi:

 
 
 

Kommentare


bottom of page