"Jedná se o obor informatiky, který se zabývá vývojem systémů a programů schopných vykonávat úkoly, jež běžně vyžadují lidskou inteligenci.
Umělá inteligence je schopnost strojů napodobovat lidské myšlení, učení a rozhodování. Využívá se ve stále více oblastech každodenního života. Umí se učit z dat, plánovat, rozhodovat či
samostatně řešit úkoly, rozpoznávat obrazy a zvuky, řídit vozidla, rozumí přirozenému jazyku a je schopna jeho překladu. Vývoj AI přináší výhody, ale i etické otázky a výzvy týkající
se bezpečnosti a odpovědnosti."
Já volně navážu. S umělou inteligencí je to jako s ohněm. Může být dobrým sluhou, ale také zlým pánem. Osobně jsem celkem konzervativní a všechny novoty beru dost s rezervou, protože počáteční všeobecné nadšení po čase často vystřídá rozčarování z toho, jak ta nová věc může člověku zkomplikovat život. A to se netýká jen AI. Pocítil jsem to sám při přechodu z analogového ovládání na digitální. Nesporné výhody digitálu jsou vykoupeny starostmi a hodinami bádání, rozčilováním a reklamacemi. Zatímco analogovou lokomotivu postavíte na kolejiště a zpravidla jede, u digitálu tomu tak vždy není. Mluví ze mne zkušenosti, sám už jsem několik závad zapříčiněných dekodérem reklamoval.
Ale zpět k AI. Trochu jsem začal koketovat s
ChatGPT.
Generative Pre-trained Transformer
Konverzační model založený na generativní, předtrénované transformátorové architektuře. Jinými slovy: je to AI model, který
rozumí jazyku a umí s uživatelem přirozeně konverzovat díky pokročilé architektuře.
Nejdříve jen na pokec, následně jsem začal využívat i dočasnou možnost generování obrázků na základě předložení vlastních fotografií. A když už jsem tomu věnoval čas, myslím, že není
od věci se podělit o některé výsledky a publikovat je. Využívám pouze neplacenou verzi, takže tam bylo jisté omezení co do počtu, rozlišení a asi i co do rychlosti generování.
Placená verze ChatGPT Plus přináší za cenu 20 $ měsíčně možnost využití GPT-4o (Omni) – nejnovějšího a nejchytřejšího modelu, rychlejší odezvy, prioritního přístupu i při vyšším
zatížení serverů. Pak je k dispozici verze Pro za 200 $ s dalšími výhodami, které zde popisovat nebudu. Já si vystačil s volnou omezenou verzí (registrace je však nutná),
na to mé občasné a dočasné hraní stačila, nebylo tedy nutno do ničeho investovat. V současnosti však již ve volné verzi generování obrázků nefunguje.
Jak ukazuje galerie níže, některé fotky jsou povedené, jiné méně, další ještě méně a čas od času je výsledný výtvor na hony vzdálen předloženému originálu. Musím zdůraznit, že ChatGPT
ve volné verzi nezasahovala do původních snímků. Pouze se jimi inspirovala a na jejich základě generovala úplně nové obrázky. Bylo nutno zadat dosti přesné instrukce, abyste získali obrázek
jakž takž podle vašich představ, ale stejně to bylo většinou s jistou dávkou kompromisu. I když jsem se AI vyloženě zeptal, jak mám požadavek formulovat, a tímto pokynem jsem se následně řídil,
stejně se jím pak neřídila ona. Chtěl jsem zachovat kompozici, číslo lokomotivy, úhel pohledu... I tak něco z toho nedodržela. Neuměla třeba vykreslit správně koleje. Někdy ano, ale většinou ne.
Na dotaz, proč tomu tak je, jsem dostal odpověď, že chybí pochopení perspektivy a pravidel geometrie, nemá skutečné prostorové porozumění. Nechápe, že koleje jsou tvořeny dvěma rovnoběžnými
kolejnicemi se specifickým rozchodem a pravidelnými pražci a že se nesmí křížit nesmyslně. Má zatím potíže s pravidelně se opakujícími vzory a paralelními liniemi v perspektivě.
V některých případech je „rozbila“ nebo zakřivila, protože generuje obraz po částech (tzv. patch-based přístup). Nerozumí tomu, jak koleje fungují v reálném světě – že vlaky potřebují
plynulé oblouky, výhybky, správné napojení. Vytvoří tedy obraz, který „vypadá jako koleje“, ale technicky bývá mnohdy nesmyslný. Občas lze nedostatky doladit ručně v editoru, většinou
však nikoli. Často se také stávalo, že vozy či lokomotivy byly částečně postaveny mimo kolej nebo že vozy nenavazovaly na lokomotivu, ale stály jaksi mimo, neodpovídaly proporce, počty náprav
atd. Dodržování textů a popisků je kapitola sama o sobě, nápisy na vozech nebo čísla lokomotiv byly mimo prakticky vždy, a to i v případě, že pokyn vyloženě vyžadoval jejich zachování.
Osvědčilo se mi napsat správné číslo lokomotivy přímo do pokynu, pak jej dodržela.
Samotná podoba vozidel na výsledných obrázcích má také různé úrovně věrnosti. Naše typická vozidla bývají nahrazena vozidly neurčitými či zahraničními. V tom lepším případě byl Brejlovec ČSD nahrazen relativně
věrně zpracovaným Sergejem MÁV – ten je, až na pár detailů, celkem povedený. V horším případě, jak ukazují např. fotografie 005a a 005b, byla místo Plecháče vygenerována jakási blíže neurčená
lokomotva trošičku podobná řadě E10 DB. O parních lokomotivách nemluvě.
Pro názornou ukázku si prohlédněte galerii níže. Všechny obrázky jsou v původním stavu, bez úprav, pouze trochu zmenšené. U každého záběru je vždy nejdříve originální fotografie, následuje více či méně povedený výtvor ChatGPT v různých podobách, formátech a stylech (kresba, malba, cartoon, komiks, fotorealistický obrázek, změna denní doby, počasí nebo ročního období), inspirovaný právě těmito fotografiemi. U zimních obrázků AI někdy dokonce zapomněla odstranit listí ze stromů, takže je pod sněhem vidět. To jsem řešil pokynem "odstraň listí ze stromů", ten fungoval spolehlivě.
Atmosféra některých obrázků je opravdu příjemná, má nádech té pravé železniční romantiky. O to více pak zamrzí, když je na nich nesmysl, např. právě v podobě špatně vygenerovaných kolejí nebo vozidel posazených částečně mimo ně (např. 002b, 007b). Zpravidla jsem si nechal z každé fotografie vygenerovat několik variant, zde však publikuji pouze originál a jednu vybranou.
Obrázky byly vygenerovány z originálních fotografií za použití AI. • Images were generated from original photographs using AI.
