Përdoruesi:Roboti Tung/Importimi automatik i artikujve


Kjo faqe u vjen në ndihmë përdoruesve të cilët kanë njohje të avancuar mbi strukturën dhe funksionimin e Wikipedias. Në qoftë se ju nuk dini ende të redaktoni një faqe mund tia filloni këtu, në qoftë se nuk dini se si krijohet një artikull fillojani këtu. Hapat e mëposhtëm janë më kompleksë dhe jo vetëm që kërkojë të keni përvojë në Wikipedia, por edhe në gjuhët e programimit Python, PHP etj.


Importimi automatik i artikujve është një funksion shumë i dobishëm në Wikipedia. Kështu mund ti kursejmë vetes kohë dhe energji. Dobia e "impotimit automatik" shfaq gjithë potencialin e saj në rastin e artikujve që lidhen nga e njëjta temë. Përpara se të futemi në hollësi; duhet të dini se ky nuk është një funksion i brëndshëm i Wikipedias, por realizohet përmes mjeteve të jashtme siç janë robotët. Ekzistojnë disa platforma robotësh që kryejnë këtë funksion, por më poshtë do të përmëndet vetëm platforma e robotëve në gjuhën Python që operojnë përmes pywikipedia framework, mënyrë që është testuar edhe më parë në Wikipedian në shqip përmes Robotit Tung. Për të njohur më tej platformën e robotëve pywikipedia vizitoni faqen Botwiki.

Grumbullimi i të dhënave

Redakto

Për të krijuar një artikull të ri detyrimisht që do të kemi nevojë për të dhënat (informacionin). Informacioni i grumbulluar më pas duhet të listohet. Një mënyrë se si të listoni informacionin e grumbulluar përshkruhet më poshtë. Hapni programin   Microsoft Excel dhe krijoni një tablë; ku çdo rresht do të përfaqësojë artikullin me informatat ndërsa çdo kollonë grupin e informatave.

Për shëmbull; do të krijojmë një listë me artikuj të rinj për komunat në qarkun BotoşaniRumani. Informacioni për të cilin kemi nevojë përfshin: koordinatat gjeografike, popullsinë, sipërfaqen, lartësinë, kodin postar, numrin e fshatrave dhe vetë fshatrat. Informacioni mbi shtetin dhe qarkun është i përbashkët dhe nuk është i nevojshëm të shënohet në këtë hap. Një mënyrë e lehtë për të grumbulluar informacion në këtë rast do të ishte nga Wikipeditë homologe, por mund të shfrytëzohen edhe faqe specifike si:

Mbledhja e informacionit në këtë rast është manual. Në programin MS Excel ju do të krijoni një tabelë si më poshtë.

Një mënyrë tjetër për të grumbulluar informacion në formë tabelare është përmes templatetiger. Ja një shëmbull ku listohen të gjithë artikujt që ka Wikipedia italiane për vendbanimet në Shqipëri https://toolserver.org/~kolossos/templatetiger/tt-table4.php?lang=itwiki&template=Divisione%20amministrativa&where=Stato&is=ALB&&offset=0&limit=1000.

Hapi i parë

Redakto
  Grumbullimi dhe listimi i informacionit
Artikulli gjer_G gjer_M gjer_S gjer_DR gjat_G gjat_M gjat_S gjat_DR Pop. Sip. Kodi Nr. Fshatrat Harta foto
Adăşeni 48 4 0 N 26 56 0 E 6871 97,56 717005 6 Albeşti, Buimăceni, Costiugeni, Jijia, Măşcăteni, Tudor Vladimirescu Albesti jud Botosani.png
Albeşti (Botoşani) 47 42 0 N 27 4 0 E 1556 22,80 717016 2 Adăşeni dhe Zoiţani
Avrămeni 48 1 0 N 26 57 0 E 3841 111,40 717015 7 Aurel Vlaicu, Avrămeni, Dimitrie Cantemir, Ichimeni, Panaitoaia, Timuş, Tudor Vladimirescu Avrameni jud Botosani.png
  • Artikulli - përfaqëson titullin ekzakt të artikullit që do të krijojmë.
  • gjer_X dhe gjat_Y - përfaqësojnë koordinatat gjeografike të komunës (në rastin tonë).
  • Pop. - Pupullsia e komunës.
  • Sip. - Sipërfaqja e komunës.
  • Kodi - Kodi postar i komunës.
  • Nr. - Numri i fshatrave të komunës.
  • Fshatrat - Fshatrat e komunës.
  • Harta foto - Figurë e hartës së komunës.

Hapi i dytë

Redakto
  Vendosja e parametrave

Deri më tani kemi krijuar një dokument me të dhënat më të nevojshme në formatin .xls ose .xlsx, i cili nuk është formati përfundimtar nga ku do të shfrytëzohen të dhënat. Formati përfundimtar do të jetë .txt (pra vetëm tekst i thjeshtë).

Robotët vërtet janë të shpejtë e të dobishëm, por kjo nuk do të thotë se janë të zgjuar. Tabela e mësipërme mund të interpretohet fare lehtë prej çdo njeriu, por jo prej robotit. Do të duhet që këtë tabelë ta ndërtojmë në atë mënyrë që ta interpretojë edhe roboti. Të gjitha informacionet që kemi listuar për ne quhen vlera, në mënyrë që roboti ti lexojë duhet ti lidhim me një çelës parametrik; kështu | parametri = vlera .

Adăşeni | gjer_G = 48 | gjer_M = 4 | gjer_S = 0 | gjer_DR = N | gjat_G = 26 | gjat_M = 56 | gjat_S = 0 | gjat_DR = E | pop = 6871 | sip = 97,56 | kodi = 717005 | nr = 6 | fshatrat = Albeşti, Buimăceni, Costiugeni, Jijia, Măşcăteni, Tudor Vladimirescu | harta = Albesti jud Botosani.png
Albeşti (Botoşani) | gjer_G = 47 | gjer_M = 42 | gjer_S = 0 | gjer_DR = N | gjat_G = 27 | gjat_M = 4 | gjat_S = 0 | gjat_DR = E | pop = 1556 | sip = 22,80 | kodi = 717016 | nr = 2 | fshatrat = Adăşeni dhe Zoiţani | harta =
Avrămeni | gjer_G = 48 | gjer_M = 1 | gjer_S = 0 | gjer_DR = N | gjat_G = 26 | gjat_M = 57 | gjat_S = 0 | gjat_DR = E | pop = 3841 | sip = 111,40 | kodi = 717015 | nr = 7 | fshatrat = Aurel Vlaicu, Avrămeni, Dimitrie Cantemir, Ichimeni, Panaitoaia, Timuş, Tudor Vladimirescu | harta = Avrameni jud Botosani.png

Siç mund ta vini re tabela filloi tu ngjajë stampave ku ne përcaktojmë një vlerë për çdo parametër.


Hapi i tretë

Redakto
  Faqja shëmbull

Deri tani i kemi përcaktuar robotit se cilat janë vlerat përmes parametrave, por nuk i kemi përcaktuar:

  • titullin e vetë artikullit:
Në mënyrë që të përcaktojmë titullin e artikullit duhet të që atë ta vendosim brënda thonjëzave treshe, kështu: '''Titulli'''.
  • ku fillojnë dhe ku mbarojnë vlerat e një artikulli:
Në mënyrë që të përcaktojmë se ku fillon një artikull vendosim 4 x-a kështu, xxxx ndërsa për të përcaktuar se ku mbaron vendosim 4 y-a atje ku mbaron, kështu yyyy.
  • faqen shëmbull sipas së cilës të krijojë faqet e tjera:
Në mënyrë që ti përcaktojmë faqen shëmbull ne duhet ta krijojmë një faqe të tillë. Në këtë rast si faqe shëmbull po përdorim Përdoruesi:Roboti Tung/Faqja shëmbull. Në mënyrë që roboti ti përdorë vlerat e tabelës duhet që të përdorim funksionin {{subst: ...}}. Veprojmë kështu: pas thonjëzave mbyllëse që përcaktojnë titullin dhe para se të fillojë | parametri i parë shtojmë një kolonë të re dhe vendosim {{subst:Faqja shëmbull. Në fund të parametrit të fundit por para 4 y-ave yyyy vendosim }} kllapat mbyllëse të funksionit {{subst}}.
xxxx''' Adăşeni '''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull | gjer_G = 48 | gjer_M = 4 | gjer_S = 0 | gjer_DR = N | gjat_G = 26 | gjat_M = 56 | gjat_S = 0 | gjat_DR = E | pop = 6871 | sip = 97,56 | kodi = 717005 | nr = 6 | fshatrat = Albeşti, Buimăceni, Costiugeni, Jijia, Măşcăteni, Tudor Vladimirescu | harta = Albesti jud Botosani.png }}yyyy
xxxx''' Albeşti (Botoşani) '''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull | gjer_G = 47 | gjer_M = 42 | gjer_S = 0 | gjer_DR = N | gjat_G = 27 | gjat_M = 4 | gjat_S = 0 | gjat_DR = E | pop = 1556 | sip = 22,80 | kodi = 717016 | nr = 2 | fshatrat = Adăşeni dhe Zoiţani | harta = }}yyyy
xxxx''' Avrămeni '''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull | gjer_G = 48 | gjer_M = 1 | gjer_S = 0 | gjer_DR = N | gjat_G = 26 | gjat_M = 57 | gjat_S = 0 | gjat_DR = E | pop = 3841 | sip = 111,40 | kodi = 717015 | nr = 7 | fshatrat = Aurel Vlaicu, Avrămeni, Dimitrie Cantemir, Ichimeni, Panaitoaia, Timuş, Tudor Vladimirescu | harta = Avrameni jud Botosani.png }}yyyy

Hapi i katërt

Redakto
  Ruajtja në formatin .txt me kodim UTF-8

Meqë më lart thamë se roboti nuk e njeh formatin .xls atëherë duhet që këtë databazë ta ruajmë në formatin .txt. Kopjoje të gjithë databazën, përdor këtë faqe për të larguar hapësirat boshe dhe në fund ruaje përmajtjen në formatin txt me kodim UTF-8 (Encoding: UTF-8). Me kaq kemi përfunduar skedarin i cili është gati të përdoret prej robotit.

xxxx'''Adăşeni'''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull| gjer_G =48| gjer_M =4| gjer_S =0| gjer_DR =N| gjat_G =26| gjat_M =56| gjat_S =0| gjat_DR =E| pop =6871| sip =97,56| kodi =717005| nr =6| fshatrat =Albeşti, Buimăceni, Costiugeni, Jijia, Măşcăteni, Tudor Vladimirescu| harta =Albesti jud Botosani.png}}yyyy
xxxx'''Albeşti (Botoşani)'''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull| gjer_G =47| gjer_M =42| gjer_S =0| gjer_DR =N| gjat_G =27| gjat_M =4| gjat_S =0| gjat_DR =E| pop =1556| sip =22,80| kodi =717016| nr =2| fshatrat =Adăşeni dhe Zoiţani| harta =}}yyyy
xxxx'''Avrămeni'''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull| gjer_G =48| gjer_M =1| gjer_S =0| gjer_DR =N| gjat_G =26| gjat_M =57| gjat_S =0| gjat_DR =E| pop =3841| sip =111,40| kodi =717015| nr =7| fshatrat =Aurel Vlaicu, Avrămeni, Dimitrie Cantemir, Ichimeni, Panaitoaia, Timuş, Tudor Vladimirescu| harta =Avrameni jud Botosani.png}}yyyy

Importimi automatik

Redakto
 
Më vjen keq të zhgënjej përfytyrimin tuaj, por ky është roboti për të cilin iu fola!

Gjithë procesi i mësipër u realizua manualisht, tani është rradha e robotit të krijojë automatikisht artikuj nga skedari i krijuar prej nesh. Importimi automatik i artikujve në Wikipedian në shqip është realizuar edhe më parë prej Robotit Tung. Në qoftë se keni krijuar skedarin .txt dhe dëshironi të krijoni artikuj të automatizuar më lini në njoftim në faqen time të diskutimit Përdoruesi diskutim:Euriditi dhe unë do të drejtoj robotin ti krijojë.

Artikujt që dëshironim të krijonim Adăşeni, Albeşti (Botoşani), Avrămeni‎ u krijuan automatikisht prej Robotit Tung. Për lehtësi të guidës u përdorën 3 artikuj, por ju mund të përdorni aq artikuj sa dëshironi. Zakonisht ky funksion shërben për që krijuar artikuj në masë, disa qindra apo mijëra artikuj përnjëherë.

Kodi i ekzekutimit
pagefromfile.py -notitle -start:xxxx -end:yyyy -file:text.txt