Avagy: minden, amit tudni akartál a mesterséges intelligenciáról a fotózásban, de nem merted megkérdezni.
Az utóbbi időben a csapból is a mesterséges intelligencia folyik. Vannak, akik ujjonganak. Vannak, akik megijedtek. Vannak, akik homokba dugják a fejüket. És persze vannak, akik vérbeli aranyásóként azonnal rávették magukat és kihozták a “világmegváltó” eszközeiket és kurzusaikat.
Azt tapasztalom, hogy iszonyatosan nagy a zavar a fejekben a mesterséges intelligenciával kapcsolatban. Sokan azt sem tudják, miről beszélnek valójában. Esetleg habzó szájjal ellene vannak, holott valójában évek óta ilyen eszközöket használnak. Csak éppen nem is tudtak róla.
Teljesen érthető ez a hangulat és állapot, hiszen a legnagyobb hangadók mindig azok, akiket semmi más nem érdekel, mint hogy az “új őrületből” pénzt csináljanak. Nekik az a jó, ha minél jobban összezavarodsz és megvásárolod a megváltást, amit kínálnak.
Az utóbbi hónapokban rengeteget foglalkoztam a mesterséges intelligencia témájával. Egyszerűen azért, mert érdekel. Mindig lázba hoz a technológiai fejlődés, az, hogy bizonyos dolgok egyszerűbbé és gyorsabbá válnak. Örökké elhavazott kisvállalkozóként megváltásként tekintek minden olyan eszközre, ami azt adja vissza, amiből a legkevesebb van: az időmet. Az időt, amit “favágás” helyett másra fordíthatok. Például tanulásra és egy ilyen ismeretterjesztő poszt elkészítésére. Vagy más olyan dolgokra, amik emberi gondolkodást igényelnek. Amik előre viszik az életemet vagy csak a vállalkozásomat.
Ennek a posztnak az a célja, hogy végre te is tisztán láthasd azt, hogy mi is az a mesterséges intelligencia és mit jelent számodra a fotózásban! Milyen eszközökre támaszkodhatsz, és ezeket hol és hogyan éred el. Hova vezet ez az egész, elveszi-e a munkádat? Szeretném teljesen tisztába tenni a témát (legalábbis amennyire ez jelen pillanatban lehetséges), hogy ne maradjon benned megválaszolatlan kérdés. Így előfordulhat, hogy a visszajelzések fényében frissíteni fogom ezt a cikket.
Tudom, ez egy hosszú cikk. Bár úgy gondolom, megéri elolvasni akár az egészet is, teljesen megértem, ha csak egy adott téma érdekel. Az alábbi kérdésekre fogsz választ kapni, kattints bátran arra, ami érdekel!
Kérdések és válaszok
Mit jelent a mesterséges intelligencia (MI, artificial intelligence, AI)?
A mesterséges intelligencia olyan számítógépes rendszerek elmélete és fejlesztése, amelyek általában emberi intelligenciát igénylő feladatokat képesek ellátni.
Mi minden tartozik a mesterséges intelligencia körébe a fotózásban?
A fényképek elemzése a mesterséges intelligencia segítségével
Az AI képes a képek elemzésére, azaz például objektumok felismerésére: így egyetlen kattintással jelölhetsz ki személyeket, tárgyakat vagy éppen az eget a képen. A felismert objektumok, személyek kereshetővé és kategorizálhatóvá válnak, hiszen tudja, hogy mi vagy ki van a képen. Így képes akár a személyek szerinti leválogatásra és akár a képfájlok ezek alapján történő menedzselésére is.
A kép elemzése teszi azt is lehetővé, hogy bizonyos területeket tartalomérzékenyen kitöltsön a képen. Azaz például eltüntessen egy embert és kipótolja a mögötte lévő épületet annak máshol látható mintázata vagy akár más fotók alapján. A személyek és arc felismerése lehetővé teszi akár bizonyos részek, a bőr, a szem vagy a haj azonosítását is, és azoknak a területeknek a kijelölését és módosítását.
A fotók elemzése a mesterséges intelligencia eszközeivel
Az elemzés mellett a képek szerkesztése a másik fő funkció, aminek segítségével végezhetők például automatikus korrekciók. Egyszerre, tömegesen dolgozhatunk fel képeket, kijavíthatunk sérült képeket vagy kis méretű fotókat nagyíthatunk fel. Akár stílusokat is átvihetünk egyik képről a másikra. De ide tartozik az automatikus bőrsimítás és portréretus lehetősége is.
Képek generálása mesterséges intelligenciával
A harmadik terület a képek generálása, azaz a meglévő képek kombinálása vagy teljesen új képek létrehozása. Gondolok itt például az olyan képgenerátorokra, amilyen a Midjourney vagy a Dall-E. Az így alkotott képek akár kreatív ötletek megvalósítására vagy egyéb inspirációra is használhatók. Ha korábban a Pinteresten vagy az Instagramon keresgéltél fotókat egy moodboardhoz, ma már a mesterséges intelligenciát is segítségül hívhatod.
Szóval miről is beszélünk? Mi az, ami segítség és jó dolog, és mi az, ami már túl sok és káros?
- Ha a fényképezőgépeden az egy pontosnál nagyobb fókuszterületet választasz, akkor a gép dönt helyetted, hogy pontosan mi legyen éles. A legtöbb fotósnak, akit ismerek, ezzel semmi gondja, előszeretettel használja.
- Ha a fényképezőgépeden szemkövetést használsz, akkor a mesterséges intelligencia dolgozik helyetted, ami felismeri az embert/állatot és a szemére fókuszál. Akinek tudja a gépe, többnyire ódákat zeng róla, hogy mekkora segítség.
- Ha a fényképezőgépeddel vagy mobiloddal JPG-ben fotózol, akkor egy algoritmus fogja eldönteni, hogy pontosan hogyan dolgozza ki a szenzoron keletkező képet (automatikusan utómunkáz). Sokan úgy gondolják, ez az “igazi” kép, holott erről is valójában egy gép döntött helyetted.
- Ha nyers képet készítesz, amin azután automatikus szerkesztést végzel (pl. Lightroom Develop vagy Adobe Camera Raw / Basic / Auto), az megint csak a kép elemzése révén eldönti helyetted, milyen legyen a fotó. Ez rendben van, vagy köszönöd szépen, majd te csinálod magadnak?
- Ha portrét retusálsz, a kézzel végzett frequency separation még belefér, de egy Portraiture, Portrait Pro vagy Luminar Neo már nem? Vagy pont előszeretettel támaszkodsz az utóbbiakra, hogy időt spórolj?
- Ha eltüntetsz egy pattanást vagy kukát egy képről, akkor megint csak valamilyen algoritmus fog működésbe lépni, ami a kép egy másik részét használja fel a javításra, vagy akár a tanulási képadatbázisa alapján végzi el a műveletet. Az még rendben van, ha a te fotód alapján történik a javítás? Az már nincs, ha esetleg az Adobe Stock adatbázisa alapján?
- Ha új elemeket generálsz egy képhez, például kiterjeszted vagy hozzáadsz, esetleg teljesen új képet hozol létre, az már ördögtől való? Vagy az sem?
Kinek hol a határ? Talán a fentiekből is látszik, hogy nem is olyan egyértelmű a válasz. Ezek mindegyike beletartozik a mesterséges intelligencia körébe. Csak némelyik már annyira része a napi életünknek, hogy nem is gondolunk rá, hogy ilyen megoldást használunk.
Hogyan állnak a mesterséges intelligenciához a hazai fotósok?
Ami a fotósok hozzáállását illeti, négy főbb csoportot láttam kirajzolódni a véleményekben. Azon a hozzáálláson kívül, amit én is képviselek, hogy intenzíven belevetették magukat az AI világba, és bár látják a kihívásokat, de igyekeznek a jó oldalát nézni és a legtöbbet kihozni belőle. A csoportosítás célja nem az, hogy bárkinek a véleményét minősítse, hanem a különböző álláspontok bemutatása, illetve segítség azoknak, akik többet szeretnének tudni a témáról.
Kétkedők és Tradicionálisok: Ebbe a csoportba azokat a véleményeket sorolom, amelyek nem tartják hasznosnak vagy értékesnek az MI technológiát a fotózásban, illetve azokat is, amelyek a bevált technikákat részesítik előnyben és idegenkednek az újításoktól. Jellemző vélemények:
- Értelmetlen időtöltésnek, legfeljebb jó (vagy rossz) “poénnak” tartják a mesterséges intelligenciával való foglalkozást, aminek már semmi köze sincs a fotózáshoz.
- Kifejezetten szomorúak miatta és károsnak tartják a fotósok számára. A fotós tudás leértékelődik, már nem az fog jó képet készíteni, aki megtanult fotózni, hanem aki jobban használja az MI eszközöket. (Erről lesz még szó később.)
- Szeretik a bevált dolgokat, nem foglalkozolnak valamivel csak azért, mert “új és menő”. MILC-re sem váltottak, mert úgy érzik, marketing-rizsa az egész.
- Már az utómunkától is idegenkednek, mert úgy gondolják, az kész fotó, ami kijön a gépből. Minden, ami “mesterséges”, rosszul cseng. (Erről is lesz még szó.)
- Úgy gondolják, van már egy kialakult, működő munkafolyamat, amiben nincs szükség további eszközökre.
Passzívak és Kezdők: Azokat a véleményeket sorolom ide, amikor hobbiként foglalkoznak a fotózással és elsősorban az alkotás örömét keresik benne, illetve azokat, amikor még csak kezdik a fotózás tanulását, és úgy gondolják, hogy először az alapokat kell megtanulni.
- Nem igazán érdekeli a téma. Hobbifotós, aki csak élvezni szeretné az alkotás örömét, akár az utómunkában is. (Ez teljesen rendben is van, semmi sem “kötelező”.)
- Kezdő fotós és úgy érzi, először az alapokat kellene megtanulni, aztán jöhet az MI, ami már haladó szint. (Szerintem vannak olyan megoldások, amikre akár kezdettől érdemes támaszkodni, ezekről lesz is szó.)
Kivárásra játszók és Összezavartak: Ide tartozik, amikor még várakozó állásponton vannak az MI technológiával kapcsolatban, vagy érdeklődnek ugyan, de nem tudják, hogyan kezdjenek hozzá.
- Úgy érzik, még gyerekcipőben jár ez a történet, így ráérnek még foglalkozni vele. (A fejlődés gyorsabb, mint gondolnánk!)
- Érdekli őket, de – érthető módon – csak kapkodják a fejüket, igazából nem tudják, hogy mit jelent pontosan. Érzik, hogy foglalkozni kellene vele, de akkora katyvasz az egész, hogy nem jutnak egyről a kettőre. (Ez a cikk pont azért született, hogy legyen egy összefoglaló a témában.)
- Nem látják át, hogy milyen eszközök vannak és ezeket pontosan hol lehet elérni, mit próbálhatnak ki ingyen és mi az, amiért már fizetni kell. Utóbbitól érthető módon idegenkednek. (Ilyen esetben is nagy segítség lesz ez az anyag.)
Csalódottak és Kételkedők: Ebbe a csoportba tartoznak azok a vélemények, amikor már próbálgatták az MI eszközöket, de nem kapták meg a várt eredményeket, illetve azok, ahol a kétségeik miatt szkeptikusak az MI potenciáljával kapcsolatban.
- Próbálgatták az eszközöket, de nem hozták a várt eredményt. Sőt akár egyáltalán nem is teljesítette a rendszer a feladatot kapacitás probléma vagy egyéb hiba miatt. (Bár ez az anyag a “gyermekbetegségek” kiküszöbölésében nem tud segíteni, de talán egy jobb feladatadásban igen.)
- Nézegették az eszközöket, megoldásokat és levonták azt a következtetést, hogy ez az egész egy giccs, fantáziavilág, ami tőlük nagyon távol áll. (Éppen ezért ebben az anyagban nemcsak erről a területről lesz szó!)
Már ebből is látszik, hogy mennyire nem egységes a mesterséges intelligencia megítélése és a különböző emberek mennyire mást értenek alatta. Míg valaki az automatizmusokra, gyorsításra gondol először, mások már a képgenerálásra. A posztnak az is célja, hogy lehetőleg ugyanazt értsük alatta, egy komplex eszköztárat, amiből mindenki kiválaszthatja azt, amire szüksége van és ami a saját értékrendjével összeegyeztethető.
Miben különbözik a mesterséges intelligencia a gépi tanulástól (ML, machine learning)?
A fotózástól kicsit hátrébb lépve, de mindig fotós példákkal élve, nézzük meg az alapokat! A gépi tanulás a mesterséges intelligencia egyik alterülete, egy program vagy rendszer, amely modellt tanít be bemeneti adatokból. A bemeneti adat lehet például óriási mennyiségű szöveg vagy kép.
Az ML lehetővé teszi a számítógépek számára, hogy kifejezett programozás nélkül tanuljanak. Amikor fotósként egy olyan szoftvert használsz, ami képes felismerni és címkézni a fotókon lévő tárgyakat és embereket, az a gépi tanulásnak köszönhető.
A gépi tanulási modellek két fő osztályba sorolhatók: felügyelt (címkézett adatokkal dolgozó) és felügyelet nélküli (címkézetlen adatokkal dolgozó) tanulási modellek.
- A felügyelt tanulás során korábbi példákból tanulunk, hogy előre jelezzük a jövőbeli értékeket. Tehát például az elmúlt években eladott fotózásaidból kiindulva becslést tesz arra, hogy ez idén hogyan fog alakulni.
- A felügyelet nélküli problémák arról szólnak, hogy a nyers adatokat nézzük, és megnézzük, hogy természetes módon csoportokba esnek-e (felfedezés). Erre példa lehetne egy olyan alkalmazás, amely elemzi az Instagram profilodon közzétett fotókat és képes azokat témakörök (pl. esküvői, családi és portré fotók) vagy színsémák szerint csoportosítani.
A gépi tanuláson belül a mélytanulás (deep learning) mesterséges neurális hálózatokat használ, ami lehetővé teszi, hogy bonyolultabb mintákat dolgozzanak fel, mint a hagyományos gépi tanulás (félig felügyelt tanulás / semi-supervised learning). Például olyan fotós alkalmazást használhatsz, amely képes “megtanulni” a stílusodat, és javaslatokat tesz a legmegfelelőbb beállításokra a jövőbeni képeidhez, mindezt a korábbi fotóid elemzésével.
A mély tanuláson belül két modell típust különíthetünk el, a diszkriminatív (discriminative) és a generatív (generative) modelleket.
- A diszkriminatív modelleket osztályozásra vagy előrejelzésre használják. Jellemzően címkézett adatokból álló adatkészletre tanítják, aminek során megtanulja az adatpontok jellemzői és a címkék közötti kapcsolatot. Gyakorlati példa erre a különböző műfajokba tartozó képek felismerése – tájkép, portré, eseményfotó stb. – vagy akár a különböző objektumok, személyek azonosítása a fotón.
- A generatív modellek új adatokat generálnak, amelyek hasonlóak a betanítási adatokhoz. Megérti az adatok elosztását és azt, hogy egy adott példa mennyire valószínű. Pl. megjósolja a következő szót a sorozatban. A gyakorlatban egy ilyen modell képes például arra, hogy leírja azt, hogy mi van egy fényképen vagy leírás alapján képet generáljon.
Ha téged is érdekel ez a téma, akkor ajánlom a Google ingyenesen elvégezhető tanfolyamát (Generative AI learning path), amire nagyban támaszkodtam a poszt készítése során.
Mit jelent a generatív mesterséges intelligencia?
A generatív mesterséges intelligencia a mély tanulás egyik részterülete, amely meglévő tartalmakból tanultak alapján hoz létre új tartalmat. A meglévő tartalmakból való tanulás folyamatát tréningnek (training) nevezzük, és ennek eredményeként egy statisztikai modell jön létre. Amikor kap egy parancsot, a generatív mesterséges intelligencia ezt a statisztikai modellt használja annak előrejelzésére, hogy mi lehet a várható válasz – és ez új tartalmat generál.
A nyelvi és képi generatív modellek ezen belül két nagyon fontos és széleskörűen alkalmazott területet képviselnek. A generatív nyelvi modellek – amilyen például a GPT-4 – a képzési adatokon keresztül tanulják meg a nyelvi mintákat. Aztán adott szöveg alapján megjósolják, mi következik. Így képesek kiegészíteni, vagy új szövegkörnyezetben folytatni az adott szöveg tartalmát. Ilyen megoldás például a ChatGPT, aminek használatáról egy külön ebookot készítettem.
A generatív képi modellek új képeket hoznak létre olyan technikák segítségével, mint a például diffúzió (diffusion). Egy parancs vagy kapcsolódó kép alapján a véletlenszerű zajt képpé alakítják, vagy parancsokból képeket generálnak.
Erre példa az, amikor kitöltünk egy hiányzó részt egy képen, úgy, hogy a program a kép többi részét figyelembe veszi, és arra alapozva generálja a hiányzó részt. Vagy akár a korábbi minták alapján teljesen új képeket hozunk létre, például a Midjourney segítségével.
Mit jelent a nagy nyelvi modell (LLM, large language modell)?
A nagy nyelvi modellek (LLM, Large Language Models) a mély tanulás egyik alcsoportját képezik. Ezek a modellek képesek különböző szöveges tartalmakat generálni vagy szövegeket értelmezni és azokra válaszolni.
Az LLM-ek nem tekinthetők információkereső rendszereknek, mivel nem adatbázisból “keresnek elő” konkrét információt, hanem a meglévő nyelvi struktúrákat és mintákat használják fel az új tartalmak generálásához. Ezenkívül nem determinisztikusak, azaz nem ugyanazt az eredményt adják minden alkalommal ugyanarra a bemenetre (parancsra).
Az LLM-ek kimenetei randomizáltak, a generálás folyamata alapvetően egy valószínűségi eloszlás alapján történik. Ez azt jelenti, hogy nem feltétlenül a legvalószínűbb szó kerül kiválasztásra minden alkalommal. Ennek oka, hogy a nyelvi modellek célja, hogy a nyelv valóságos, természetes használatát modellezzék.
Fotós vállalkozók számára az LLM-ek különösen hasznosak lehetnek például marketing szövegek generálásához, blogbejegyzésekhez vagy akár a fotókhoz kapcsolódó történetek megírásához, ahogyan erről a ChatGPT gyakorlati használatát bemutató ebookban részletesen szó van.
Érdemes megemlíteni a “hallucináció” jelenségét, amely a modellek természetéből fakad. A hallucinációk olyan a modell által generált állítások, amelyek értelmetlenek vagy más szempontból helytelenek. A jelenség általában abból ered, hogy a modell tanulási adatbázisa hiányos vagy téves volt, vagy a modell nem kapott elég kontextust és megkötést ahhoz, hogy helyesen válaszoljon.
Mire használhatók jól a nagy nyelvi modellek? Fordítás, tartalmak összefoglalása, ötletelés, rövidebb szövegek generálása, tartalmak átfogalmazása, nyelvtani javítások stb.
És mire nem? Tényszerűség, józan paraszti ész, aktuális események, magas szintű stratégia, érvelés és logika, humor, általánosítás, érzelmi intelligencia, következetesség, matek/számolás, emlékezés.
Mit jelent a prompt (parancs)?
Az LLM-nek bemenetként adott rövid szöveg, amely a kimenet vezérlésére használható. Azaz megmondjuk a rendszernek, hogy mit csináljon, mit várunk tőle. A bemenet minősége nagyban befolyásolja a kiemenet minőségét. Azaz attól függ, hogy mennyire kapunk jó szöveget vagy képet, hogy mennyire voltunk képesek megfelelően megfogalmazni, hogy mit szeretnénk.
Ami a parancsokat illeti, a bemenet legtöbbször szöveg, de lehet akár kép is.
- Szöveges bemenet esetén a kimenet lehet szöveg (fordítás, összefoglalás, válasz egy kérdésre, nyelvtani javítás), kép, videó, hang (szövegből hang) vagy akár valamilyen döntés (pl. játékban).
- Képi bemenet esetén a kimenet lehet szöveg (képaláírás, vizuális válasz, képkeresés), kép (nagyobb felbontás, kiegészítés) vagy videó (animáció).
Mit jelent a mesterséges intelligencia használata a fotósok számára?
A mesterséges intelligencia megkönnyíti a fotós dolgát, már a fotózás során és utána az elkészült képek feldolgozásában is, automatikusan végezve olyan beállításokat, amiket korábban kézzel kellett megtenni. Ezzel rengeteg időt spórolhatsz meg, amit egyéb feladatokra vagy akár pihenésre fordíthatsz.
Ma már nem is számít újdonságnak, hogy a fényképezőgép szoftvere felismeri például az embereket, állatokat és tudja a szemüket követni, hogy pontosan arra fókuszálva mindig az legyen éles a képen. Ezáltal sokkal könnyebben, kényelmesebben tudod elkészíteni a képeket, jobban koncentrálhatsz a fotózás egyéb vonatkozásaira (pl. legjobb pillanatok, kompozíciók megtalálása, alannyal való kapcsolat).
A mesterséges intelligencia ki tudja automatikusan dolgozni a nyers képeket a korábbiaknál sokkal fejlettebb formában, és képes olyan képek megmentésére, amelyek nem a legideálisabb körülmények között készültek, például túl zajosak lettek. Sőt egyre hatékonyabban ki tudja javítani a fotózás során ejtett hibákat is, például bemozdulást vagy rossz helyre tett fókuszt. Könnyedén tesz különleges effekteket a képekre.
Igen, ez azt jelenti, hogy egy közepes vagy akár rossz képből is elfogadhatót vagy különlegeset lehet kihozni. Egyre kevesebb tudás és gyakorlás elég ahhoz, hogy valaki vállalható minőségű fotókat legyen képes készíteni. Ez persze nem újdonság, folyamatosan ebbe az irányba tartunk a fényképezés történetében, csak a folyamat most kapcsolt rakétasebességre. Ezen gyakorlott, profi fotósként lehet ugyan keseregni, de az sajnos biztosan nem visz előre.
Milyen eszközök vannak a Lightroomban és Photoshopban, amelyek mesterséges intelligenciát használnak?
Ha használod a Lightroomot és Photoshopot, akkor jó eséllyel alkalmazod az MI eszközöket is. Az Adobe mesterséges intelligencia és gépi tanulási platformját Sensei-nek hívják. Ez arra hivatott, hogy felgyorsítsa és egyszerűsítse a kreatív folyamatot. Az Adobe Sensei képes automatizálni bizonyos műveleteket és eljárásokat, például Photoshopban segít automatikusan kiválasztani és maszkolni az objektumokat a képeken, vagy módosítani a kép színét és tónusát a kép témájától függően.
Az Adobe Firefly egy új alkalmazás, amely mesterséges intelligenciát használ, hogy képeket hozzon létre a felhasználó által megadott szöveges utasítások alapján. A kettő közötti alapvető különbség tehát az, hogy míg az Adobe Firefly új képek létrehozására használható, addig az Adobe Sensei a már meglévő képek elemzésében és automatikus szerkesztésében nyújt segítséget. A honlapjuk alapján azonban látszik egy olyan törekvés az Adobe részéről, hogy a Sensei megoldásait inkább a marketing folyamatokhoz, a Firefly megoldásait pedig a kreatív munkákhoz társítsák.
A Lightroom Classic-ban jelenleg elérhető fontosabb MI eszközök
- Auto Tone: A Basic panelen található funkció a kép gyors feldolgozását segíti, beállítva az adott képhez a program szerint ideális értékeket (expozíció, kontraszt, árnyékok, csúcsfények, szaturáció stb.). Az eredmények eléggé változatosak, a teljesen használhatótól a kifejezetten rémesig.
- Masking / Select Subject, Sky, Background, Object: A Masking alatt számos olyan lehetőség található, amely a mesterséges intelligenciát használja ahhoz, hogy bizonyos tárgyakat, személyeket kiválasszon a képen és azokhoz maszkot hozzon létre. A maszk segítségével szerkesztheted csak az adott területet. Már nemcsak személyeket, az eget vagy a hátteret választhatod ki ilyen módon, hanem az egyes emberek bőrét, haját, ruházatát stb. is. Ezzel nagymértékben gyorsíthatod meg az utómunka folyamatodat. Nemcsak azért, mert maga a kiválasztás gyorsabb egy képen, hanem azért is, mert ezeket okosan viheted át más fotókra is, tehát azokon nem egy adott formát fog kiválasztani (ami csak egy képen működik), hanem ugyanúgy az eget, személyt stb.
- Content-Aware Remove: A Healing lehetőségen belül már nemcsak a hagyományos Heal és Clone opció érhető el, hanem a Content-Aware Remove is, amely kifejezetten arra lett kifejlesztve, hogy a kijelölt dolgot eltüntesse a képről és ehhez elemzi a fotó tartalmát.
- Denoise: A korábban is elérhető zajszűrés mellé érkezett egy új, mesterséges intelligencia alapú zajszűrés. Ennek az intenzitása is állítható. Nagyon szép eredményt ad, bár gyorsnak nem mondanám.
- Adaptive Presets: Az adaptív presetek a korábban már említett okos maszkokat használják és azokra alkalmaznak bizonyos beállításokat. Olyan okos presetekről van tehát szó, amelyek például az eget vagy a személyeket automatikusan kiemelik. Használhatod akár a Lightroom alapértelmezetten elérhető adaptív presetjeit, de akár te is létrehozhatsz magadnak ilyeneket. Megint csak felgyorsítva ezzel az utómunkádat.
A Photoshopban jelenleg elérhető fontosabb MI eszközök
- Select Subject: A Quick Selection és Object Selection alatt egyaránt elérhető eszköz lehetővé teszi a képen látható személyek automatikus kiválasztását. Ez a művelet most már a felhőben (Cloud) is végezhető a még pontosabb eredmények érdekében.
- Object Selection: Hasonló a Select Subject eszközhöz, de ezzel többféle tárgyat választhatunk ki a képen. Felismeri például az eget vagy akár személyeket, az előteret, hátteret stb.
- Select Sky: A Select menüből elérhető, az égbolt automatikus kiválasztására szolgáló eszköz. Segítségével könnyedén módosíthatók az égbolt jellemzői, vagy akár teljesen új eget is tehetünk a képre.
- Sky Replacement: Kifejezetten az ég cseréjére szolgáló eszköz, mely lehetővé teszi a fotók átalakítását anélkül, hogy órákat kellene eltölteni a maszkolással és a retusálással. Nemcsak a rendelkezésre álló egekből választhatunk, hanem sajátot is feltölthetünk.
- Face Aware Liquify: A Liquify-on belül elérhető funkció az MI segítségével képes felismerni az arcokat a képen, és különböző arcvonásokat (pl. szemek, száj, orr stb.) manipulálni.
- Neural Filters: Ezek a szűrők – bár még eléggé gyerekcipőben járnak – számos új és izgalmas lehetőséget nyitnak a képek szerkesztése során. Például: bőrsimítás (Skin Smoothing), arckifejezések átalakítása (Smart Portrait), smink másolása (Makeup Transfer), képstílusok átvétele és alkalmazása (Landscape Mixer, Style Transfer), színek összehangolása (Harmonization, Color Transfer), fekete-fehér fotók színezése (Colorize), képek felnagyítása (Super Zoom), utólagos elmosás (Depth Blur), rossz minőségű képek javítása (JPEG Artifacts Removal, Photo Restoration).
- Content Aware Fill, Delete and Fill, Remove Tool: Ezek az eszközök képesek intelligensen kitölteni, törölni vagy eltávolítani a képen látható objektumokat, figyelembe véve a környező tartalmat a természetes megjelenés érdekében. A Content Aware Fill és a Remove Tool esetében figyelni kell rá, hogy a kijelölésünk valamivel nagyobb legyen, mint amit el szeretnénk tüntetni. A Delete and Fill arra hivatott, hogy pontos kijelölésen is működjön.
- Generative Fill: Ez az eszköz képes új tartalom létrehozására a képen, a Firefly technológiát használva. Ez lehetővé teszi például, hogy a képet kiterjesszük, több képet kombináljunk vagy új elemeket adjunk a képhez. Olyan területek kitöltésére is képes, amire az előbb említett eszközök nem, hiszen nemcsak az adott fotót veszi figyelembe, hanem az Adobe stock adatbázisát is, ami a tanítására lett felhasználva. Ki tud tehát “találni” olyan dolgokat, amik az eredeti képen egyáltalán nem voltak rajta. A funkció működését ebben a videóban mutattam be részletesen.
Ezeket az eszközöket megtalálod az említett programokban, ha Adobe Creative Cloud előfizetéssel rendelkezel és a szoftverek friss verzióját használod. Az előfizetések közül a Photography Plant ajánlom, abból is azt a verziót, amely egyaránt tartalmazza a Lightroom, a Lightroom Classic és Photoshop programokat.
Az egyetlen kivétel jelen pillanatban a Generative Fill, amely a Photoshop Beta verziójában érhető el. Ezt a programot külön kell telepíteni a Creative Cloud alkalmazásból. A Photoshop “sima” verzióját hiába frissíted, a poszt megírásakor ez a funkció még nem érhető el benne.
Milyen egyéb programok kínálnak mesterséges intelligencia funkciókat fotósok számára?
A mesterséges intelligencia (MI) számos fotós szoftverben jelen van, és az elmúlt években új szintre emelte a fotószerkesztést és képmanipulációt. Lehetetlen lenne az összes elérhető megoldást összegyűjteni.
Vannak önálló szoftverek, illetve olyanok, amelyek pluginként (bővítményként), vagy pluginként is elérhetők például a Lightroomban, Photoshopban vagy a Capture One-ban. A pluginok segítségével a szoftverek funkcionalitása testre szabható vagy bővíthető anélkül, hogy az alap szoftvert módosítani kellene.
A pluginok előnye, hogy könnyebben illeszthetők egy bevett munkafolyamatba, például önálló Photoshop rétegen alkalmazhatod a hatásokat. A Photoshopba épülő pluginok általában smart filterként is működnek egy rétegen (ehhez a réteget smart objectté kell alakítani), így a beállításokat utólag is módosíthatod. A pluginban végzett lépéseket felveheted Photoshop actionbe is. Természetesen minden pluginnál számolni kell valamennyi tanulási folyamattal, hogy megfelelően tudd használni.
A pluginok hátránya – azon kívül, hogy általában külön kell őket megvásárolni -, hogy szintén frissítésre szorulhatnak, amikor az alap program változik. Még ha olyat vásárolsz is, amely örökös licenszű, előfordulhat hogy már nem lesz kompatibilis az alap programmal. Emellett a pluginokat is frissítik, új funkciókkal egészítik ki, így ha nem is folyamatos, de ad hoc költséget jelenthet a számodra, ha ezeket a verziókat el szeretnéd érni. Emellett a pluginok használata lassíthatja a rendszert vagy a szoftvert, mert több memóriát és processzorkapacitást használ.
Az egyik legismertebb szoftver talán a Skylum – Luminar Neo, amelynek AI funkcióit az alábbi videóban mutattam be. A Luminar Neo egy fejlett, de mégis felhasználóbarát képszerkesztő, ami önálló programként és Lightroom, illetve Photoshop pluginként is elérhető. Számomra ugyan nem jelent alternatívát a Lightroomra és Photoshopra, de főleg a hobbifotósok között vannak, akik csak ezt használják és köszönik szépen, bőven elégedettek vele.
Szintén nagyban támaszkodnak a mesterséges intelligenciára a portré retust támogató alkalmazások, amilyen a Portraiture, a Portrait Pro, a Luminar Neón belül elérhető portré funkciók, illetve a Retouch4Me pluginok.
Az Imagenomic – Portraiture kifejezetten bőrretusra lett kifejlesztve, így mind a bőr felismerésében és a bőr maszk finomításában, mind a részletesen irányítható javításában jeleskedik. A fine art fotósok egyik nagy kedvence a kézi (pl. frequency separation) technikák mellett.
Az Anthropics – Portrait Pro már nemcsak a bőr retusálására, hanem teljes portré retusra alkalmas. A mesterséges intelligencia felismeri az arc egyes részeit, illetve azt, hogy nő, férfi vagy gyerek van a képen. A felismert részeket egyesével lehet módosítani rengeteg kontrollal. Ár-érték arányban szerintem ez a legjobb választás. A Studio Max változat arra is alkalmas, hogy egy teljes fotósorozatot feldolgozzon automatikusan (ezt persze utólag ellenőrizni kell).
A Luminar Neo is kínál portré funkciókat, bár ezek messze elmaradnak a Portrait Pro lehetőségeitől. Ennek a szoftvernek nem ez a legnagyobb erőssége, de úgy gondolom, néhány alap javításra és főleg hobbi célra ez is elegendő lehet. Ennek a 3 pluginnak a használatát az alábbi videóban mutattam be.
A high end, magazin-szintű retusálásban egyre inkább terjed a Retouch4me használata is, amelynek egyes pluginjai egy-egy utómunka folyamatra kínálnak AI alapú, automatizált megoldást (tisztítás – Heal, Dodge and Burn, bőrszín – Skin Tone stb.). Eredményben ez áll a legközelebb a profi kézi retushoz, ennek megfelelően az egyes pluginok ára is meglehetősen borsos.
Érdemes még megemlíteni a Topaz Labs-t is, amely szintén régi szereplője a képszerkesztő piacnak. Szintén elérhető önálló programként vagy pluginként. A Denoise AI a zajszűrésben, a Gigapixel AI a képek felnagyításában, a Sharpen AI pedig az életlen vagy bemozdult képek javításában jeleskedik. Ezek együtt a Photo AI csomagban érhetők el.
Néhány program – pl. a Luminar Neo – a hagyományos képszerkesztő eszközök alternatívájává nőtte ki magát, míg mások gyorsítanak és akár magasabb szintűvé tesznek olyan munkákat, amelyekhez korábban jelentős szaktudásra és akár órákra volt szükség. Mindez lehetővé teszi, hogy azok is lenyűgöző fotókat készítsenek, akik nem mélyedtek el a “kézi” utómunka rejtelmeiben. (És akkor még nem is beszéltünk a mobil alkalmazásokról.)
Emellett egyre több olyan megoldás van, ami kifejezetten az utómunka drámai meggyorsítására és automatizálására szolgál. Az Imagen AI a saját fotóid alapján alakítja ki a profilodat és szerkeszti meg hasonló módon a következő galériádat. Az AfterShoot pedig adott szempontok alapján leválogatja a fotósorozataidat, illetve náluk is elérhető már képszerkesztő funkció. Ezek a programok életmentők lehetnek olyan fotósok számára, akik akár több ezer fotóból álló galériákkal dolgoznak (pl. esküvőkön és egyéb eseményeken).
Bár nem képszerkesztő eszköz, érdemes megemlíteni a ChatGPT-t is, ami leginkább a fotós marketingben lehet a segítségedre, de akár kreatív ötleteléshez és képgeneráló parancsok megfogalmazásához is használhatod. Ami pedig a marketinget illeti, az ideális ügyfél profil kialakításától a tartalmi ötleteken át konkrét posztok vagy hirdetések szövegének elkészítéséhez egyaránt hasznát veheted. Mivel marketingesként ebben igazán mélyre fúrtam, készítettem róla egy külön ebookot, amiben részletesen elmagyarázom a lehetőségeket és hogy hogyan tudsz valóban használható eredményeket elérni.
Ha pedig szeretnél teljesen elveszni az AI eszközök tengerében, akkor a gpte.ai oldalán kategóriák szerint tudod nézegetni őket.
Milyen eszközöket használhatsz, ha képeket szeretnél generálni?
A mesterséges intelligencia világának legizgalmasabb és egyben legijesztőbb tagjai a képgenerátorok, amelyek – ahogyan arról már szó volt – szöveges vagy akár képes parancsok alapján alkotnak új képeket. A generatív mesterséges intelligenciáról szóló részben megtalálod részletesen, hogy hogyan is működnek.
Milyen lehetőségek rejlenek a képgenerálásban?
- A “semmiből” alkotsz egy új képet, képes és/vagy szöveges parancs alapján. Meghatározod, hogy mi legyen a képen, milyen megvilágításban, milyen stílusban stb. Erre a legjobb megoldás véleményem szerint jelenleg a Midjourney.
- Meglévő képet terjesztesz ki, amit a rajta lévő elemek vagy további parancsok alapján folytat a mesterséges intelligencia. Adott például egy álló formátumú tájkép, amihez új részeket hozzáadva fekvő képet készítesz belőle. Ez jó megoldás lehet akkor is, ha valami lemaradt a képről, javítanád a kompozíciót vagy egyszerűen csak más méretarányban van rá szükséged. Grafikai munkáknál ugyancsak jól jöhet, ha például több negatív térre van szükség szöveg elhelyezéséhez. Erre alkalmas például a Dall-E Outpainting (generation frame) vagy a Photoshop Generative Fill.
- Egy meglévő képet alakítasz át. Például eltüntetsz valamit, akár komplex háttér elől is. Mondjuk jó lenne megszabadulni a parkoló autóktól, de a képen magán nem látszik, hogy mi volt mögöttük. A mesterséges intelligencia a tanulási adatbázisa alapján “kitalálja” és kitölti a teret. Ide tartozik az is, amikor új elemet hozol létre: hajat, ékszert, napszemüveget, növényt, állatot, épületet, vagy akár teljes hátteret (háttércsere) stb. Meglévő képeket is összekapcsolhatsz, kompozit képet alkotva. Ezekre általában egészen jó eredményeket ad a Photoshop Generative Fill.
Mivel a képgenerálás meglehetősen erőforrás igényes, a generált képek a legtöbb esetben kis méretűek (pl. 1024×1024 pixel). Ha pedig lehetséges nagyobb terület generálása, akkor az a minőség rovására mehet (pl. a Photoshop Generative Fill esetében). Persze, vannak olyan eszközök is, amikkel ezeket felnagyíthatod (pl. Luminar Neo Upscale vagy Topaz Labs Gigapixel AI).
A különböző eszközök másképp működhetnek, mást jelenthet bennük például a képek összekapcsolása. Az egyik kulcs tényező, hogy van-e lehetőséged a rendszer tanítására (a saját fotóiddal) vagy azokat csak parancsokként értelmezi.
Vannak például kifejezetten avatar készítő alkalmazások (a legismertebb talán a Lensa), amelyekbe általában több (pl. 10-20 db) képet kell egy személyről feltölteni, amelyekből a rendszer tanul, majd a különböző stílusú avatarokhoz legenerálja az arcképet (a Lensa esetében a háttérben a Stable Diffusion modell áll). Ezek eléggé fognak hasonlítani arra a személyre, akiről képeket töltöttél fel. De nem az eredeti képek egy-egy darabját használja fel (pl. arc, szem), mint egy kézi szerkesztés során, hanem a tanultak alapján teljesen újat generál. Ezzel szemben a Midjourney – legalábbis egyelőre – ilyenre nem alkalmas, de a Photoshop Generative Fill sem a legjobb eszköz ilyen feladatra.
Mire használhatod a képgenerálást?
- Önálló alkotás, kellemes időtöltés
- Inspiráció, ötletelés fotózáshoz
- Koncepció kialakítása, moodboard összeállítása
- Hátterek, kiegészítők, textúrák generálása
- Marketing anyagok készítése stb.
Felhasználói oldalról nézve a legtöbb esetben böngészőben futó alkalmazásokról vagy mobil appokról van szó. Előfordulnak azonban más megoldások is, az egyik legnépszerűbb képgenerátor, a Midjourney például jelenleg még a Discordra épül, míg a Generative Fill funkció a Photoshop Beta verzióján belül érhető el.
Ebben a videóban be is mutattam, hogy hogyan kell használni a Midjourney-t lépésről lépésre a Discord telepítésétől a parancsok adásáig. Akkor is érdemes megnézni, ha te másik képgenerátort használsz vagy szeretnél használni, mert a gondolkodásmód nagyon hasonló. Ha ez egyiket már hatékonyan tudod alkalmazni, akkor várhatóan sokkal könnyebben boldogulsz majd egy másikkal is. A kulcs az, hogy értsd, melyik mire alkalmas és hogy az adott rendszernek hogyan tudsz olyan parancsokat adni, amelyek olyan (vagy legalább hasonló eredményt) adnak, mint amit elképzeltél.
Nagy felháborodást keltett az utóbbi időben, hogy megszűnt az ingyenes próba a Midjourney-nél, ami valahol érhető részükről, hiszen – ahogy említettem – iszonyatosan gépigényes, így meglehetősen drága is nagy tömegű képgenerálási igényt kiszolgálni. Illetve szűrni a jogi vagy etikai szempontból problémás kéréseket. Van azonban számos alternatíva, amely akár ingyenesen is kipróbálható.
Midjourney alternatívák
- Adobe Photoshop Beta – Generative fill (Adobe előfizetés szükséges hozzá vagy ingyenes próbaidőszak, továbbá a Photoshop Beta verziójának telepítése)
- DALL-E
- Stable Diffusion
- Playground
- Fotor AI Image Generator
További lehetőségeket többek között a már említett gpte.ai oldalán találsz.
Milyen problémákat vet fel a mesterséges intelligencia használata a fotózásban?
Az AI-alapú automatikus funkciók által sokkal könnyebbé válik a fotózás, egyre kevesebb technikai tudásra van szükség ahhoz, hogy valaki képeket készítsen. Így az ezzel kapcsolatos szakértelem is egyre inkább leértékelődik. Ez nyilván fájdalmas pont azok számára, akik rengeteg időt és pénzt tettek abba, hogy ezeket a képességeket elsajátítsák és begyakorolják.
A mesterséges intelligencia által létrehozott képek esetében felmerülhet az eredetiség kérdése is, hiszen az AI-alapú eszközök gyakran hasonló képstílusokat és megoldásokat alkalmaznak. Nem is beszélve a szerzői jogokról, hiszen a mesterséges intelligencia tanítására emberek által alkotott képeket (és szövegeket) használnak fel. Emellett adatvédelmi kérdések is felmerülnek, hiszen a tanulási adatok között személyes információk is lehetnek (pl. valakinek a képmása). Az AI képes létrehozni és módosítani képeket olyan módon, hogy a manipuláció szinte észrevehetetlen. Ez megint csak komoly jogi és etikai kérdéseket vet fel a valóság ábrázolásával és a képek hitelességével kapcsolatban.
A terület jogi szabályozása még világszerte folyamatban van, az EU szorgalmazza a mesterséges intelligencia által létrehozott tartalmak cimkézését, illetve összefoglalás közzétételét a rendszerek betanításához használt, szerzői jogi védelem alatt álló művekről. (Lásd még a következő kérdést és választ!)
Nem véletlen, hogy egyre többet hallani a mesterséges intelligenciával kapcsolatos félelmekről, hiszen olyan feladatokat old meg, amikhez korábban emberi munkára volt szükség. Amin valaki korábban órákig pepecselt, ma egy kattintás, ráadásul egyre jobb minőségben. De ami még ijesztőbb, hogy olyan területre is betette a lábát, amit hagyományosan emberi tulajdonságnak gondolunk: a kreativitás.
Persze, lehet vitatkozni arról, hogy mennyire kreatív az, hogy a korábban emberek által alkotott képek alapján hoz létre valami mást, és hogy ez mennyire mások munkájának a “másolása” vagy csak ugyanannyira másolás, mint ahogyan az ember is inspirálódik mások munkájából.
Bár a mesterséges intelligencia egyelőre még nem képes helyettesíteni a – magas szintű – emberi kreativitást és tapasztalatot, látszik, hogy ebből a szempontból is elképesztő iramban zárkózik fel. Az igazán kiváló kreatívok nyomába még (?) nem ért, de a középszerűeket már most lekörözi.
Kié a mesterséges intelligencia által generált tartalom és mire használhatod fel?
Egyre több olyan tartalommal találkozunk, amit részben vagy teljes egészében a mesterséges intelligencia hozott létre. Cikkek, közösségi média posztok, képek, videók… Ezek ugyan valamilyen emberi utasításra születtek, de mégsem emberek által. Ez nagy kihívást jelent a szellemi tulajdonjog területén: ki birtokolja a MI által létrehozott művek szerzői jogát? (A szerzői jogról itt olvashatsz részletesebben.)
Jogi fejtegetésekbe nem szívesen bocsátkozom, hiszen egyrészt nem vagyok jogász, másrészt a terület szabályozása még folyamatban van. Az egyes országok, államok megközelítései el is tér(het)nek egymástól. Számunkra nyilván az a legérdekesebb, hogy az EU mire jut ezzel kapcsolatban.
Most ott tartunk, hogy az Európai Parlament képviselői meghatározták a Parlament tárgyalási álláspontját a mesterséges intelligenciáról szóló törvénytervezet (EU AI Act) tanács vitáihoz. A szabályok a kockázati szintek alapján határozzák meg a kötelezettségeket a szolgáltatók és a felhasználók számára. Ez után következnek a Tanácsban folytatott megbeszélések a jogszabály végső szövegéről. Az a cél, hogy az egyezség az év vége előtt létrejöjjön, majd a jövő évi uniós választásokat megelőzően a törvény hatályba léphessen.
Ami kifejezetten a szerzői jogot illeti, a fő szabályi keret a Szerzői Jogok Irányelve (Copyright Directive), amelyet 2019-ben frissítettek. Az irányelv szerint szerzői jog védelem illeti az eredeti műveket, beleértve az MI-algoritmusok által létrehozott műveket is, az eredetiség és kreativitás kritériumainak teljesülése esetén. Azonban az irányelv nem ad világos választ arra, hogy ki birtokolja a szerzői jogot az MI által létrehozott művekben.
A probléma kezelésére az Európai Bizottság egy új jogi keretet javasolt az MI által generált művek szellemi tulajdonjogaira, beleértve a szerzői jogot is. Az új keret megadná a szerzői jog védelmét az MI által generált műveknek, de új „MI szerzőség” kategóriát is bevezetne, amelyet az MI rendszer fejlesztője vagy felhasználója birtokolhatna, nem pedig a művet létrehozó természetes személy. A jelenlegi javaslatok a tulajdonjog, a felelősség és az elszámoltathatóság tisztázására összpontosítanak. Támogatják a szerzői jogi tulajdonlás megállapítását jelentős emberi hozzájárulás esetén, és kötelező címkézési rendszert javasolnak a transzparencia érdekében.
Szóval arra a kérdésre, hogy “kié” a mesterséges intelligencia által előállított tartalom, még nem tudunk pontosan válaszolni. Dr. Nagy Dóra Adriána, az NDAlegal vezető ügyvédje szerint “attól, hogy egy MI-nek írunk egy promptot, a létrehozott alkotás még nem fog szerzői műnek minősülni, és nem illeti meg szerzői jogi védelem. Csak és kizárólag abban az esetben részesülhet egy ilyen mű szerzői jogi védelemben, ha a természetes személy valóban részt vesz az alkotásban, befolyása van az eredményre, így például a ChatGPT esetében megírt szöveget átszerkeszti, átírja, javítja, hozzátesz – tehát művészi teljesítményt produkál maga az ember. Ebben az esetben beszélhetünk tehát szerzői műről, keletkezhet jogvédelemre hivatott alkotás.”
Azaz ha használsz MI eszközöket a tartalmaid bármely részének létrehozásához, a legjobb, amit tehetsz, hogy a folyamatban lehetőleg minél több emberi kreativitást alkalmazol. Ezen felül fontos, hogy tisztában legyél vele, hogy a részletes beavatkozás sem biztos, hogy elegendő lesz ahhoz, hogy az eredményt szerzői jogi szempontból védhetővé tegyék.
Emellett mindenképp tanulmányozd az adott MI eszköz felhasználási feltételeit, mert abban is lehetnek korlátozások arra vonatkozóan, hogy a generált szöveg, kép vagy videó pontosan mire és hogyan használható fel. Előfordulhat, hogy például csak magáncélra használható, kereskedelmi célra nem. Utóbbiba tartozhat például a vállalkozásod számára készített közösségi média poszt, hirdetési kép, logo stb. stb.
Érdemes folyamatosan figyelni az ezzel kapcsolatos fejleményeket!
Öntudatra ébred-e a mesterséges intelligencia?
A mesterséges intelligencia öntudatra ébredésének kérdése nagy vitát vált ki a tudományos és technológiai közösségekben. Az MI jelenlegi állapota alapján azonban a válasz egyértelműen nem.
A mesterséges intelligencia nem rendelkezik öntudattal vagy önálló gondolkodással. A mesterséges intelligencia rendszerek algoritmusokon és programozási kódokon alapulnak, amelyek emberek által lettek megírva egy specifikus feladat megoldására, és csak a rendelkezésükre álló adatokon és előre meghatározott algoritmusokon alapuló döntéseket tudnak hozni.
Az MI nem rendelkezik érzelmekkel, motivációval, öntudattal vagy az önmagára való reflexió képességével, amelyek az emberi tudat alapvető jellemzői.
Itt érdemes beszélni a mesterséges intelligencia két fő típusáról a szűk (narrow) és az általános (general) intelligenciáról, amit a rendszerek képességei és alkalmazhatósága alapján különböztetünk meg.
A szűk intelligencia egy konkrét feladat elvégzésére van kialakítva. Az adott feladatot nagyon jól képes megoldani, de képességei korlátozottak, és nem képes átvinni a tudását más feladatokra. Ilyen például a Google Translate fordító, egy ügyfélszolgálati chat robot, vagy az ajánló rendszerek, amelyek képesek meglepően összetett és specifikus feladatokat elvégezni, de csak azokon a területeken működnek, amelyekre programozva lettek.
Az általános mesterséges intelligenciának elvileg képesnek kellene lennie bármely, az ember által elvégezhető intellektuális feladat megoldására, ilyen módon autonóm döntések hozására. Ez a fajta intelligencia széleskörű tudást igényel a világról, az emberi érzésekről, a kultúráról, a történelemről és sok más témáról. Az általános MI még mindig a kutatás fázisában van, és a valós alkalmazásban még nagyon korlátozottan jelenik meg. Például arra már képes lehet, hogy megrendeljen egy pizzát vagy fodrász időpontot foglaljon, de ez még messze van az általános mesterséges intelligencia valódi fogalmától.
Elveszi-e a fotós munkádat a mesterséges intelligencia?
Ami biztos, hogy a mesterséges intelligencia velünk marad és gyökeresen megváltoztatja a munkafolyamatokat. Az eddigi tapasztalatok alapján az látszik, hogy bár bizonyos feladatokat már átvett a mesterséges intelligencia, a teljes foglalkoztatásra eddig nem gyakorolt jelentős hatást. Azonban arról, hogy ez a későbbiekben hogyan fog alakulni, megoszlanak a vélemények.
Ami a fotózást illeti, egy dolog biztos: azok a fotósok, akik használják és kihasználják a mesterséges intelligencia lehetőségeit, óriási előnyre tesznek szert azokkal szemben, akik nem. Hiszen ha bizonyos feladatokat gyorsabban tudsz elvégezni (tehát kevesebb időt kell vele töltened), akkor jobb áron tudsz dolgozni az ügyfélnek, mint az, akinek mindez sokkal tovább tart (és tegyük fel, hogy mindenki profitot szeretne termelni). Ha emellett még magasabb szintű munkát is tudsz kiadni a kezedből vagy olyat, amit csak kevesen, megint csak növeled a piaci értékedet.
A technológia akkor is fejlődik és egyre elérhetőbbé válik mindenki számára, ha te azon keseregsz, hogy régen minden jobb volt és nem volt így “felhígulva a szakma”. Aki versenyképes szeretne maradni ebben az iparágban, annak lépést kell tartania a fejlődéssel.
Szinte biztos, hogy bizonyos típusú fotókra már sokkal kevésbé vagy egyáltalán nem is lesz szükség, vagy éppen más formában lesz rájuk szükség. Például a stock fotók helyett már most egyre nagyobb teret kapnak a képgenerátorokkal létrehozott anyagok, és a hírek szerint jobban teljesítenek, mint a hagyományos fényképek.
A tárgyfotózásnál egyre kevésbé lesz szükség hosszadalmas és drága stylingra, a “körítést” mellé teszi a mesterséges intelligencia. De azonnal betette a lábát az ingatlan fotózásba is (egy másik példa itt). Bizonyos esetekben pedig már a divatmodellek helyett is mesterséges intelligencia által generált képeket láthatunk.
Vannak, akik már azt vizionálják, hogy fotósra egyáltalán nem is lesz szükség, hiszen elég lesz néhány mobilos szelfi és képes vagy szöveges parancs, amiből a mesterséges intelligencia létrehozza a teljes fotót (vagy akár videót is). Hasonló szolgáltatások már léteznek is egyébként, bár a minőségük egyelőre megkérdőjelezhető. De csak idő és pénz kérdése, hogy valaki profi szinten megvalósítsa.
Akinek mindettől a szeme sem rebbent, az valószínűleg nem látja át, hogy hol is tartunk és milyen sebességre kapcsolt a fejlődés és változás. De még nem késtél le semmiről.
Szerintem a kulcs az, hogy nyitottnak kell lenni. Megérteni a technológiai alapokat, mert ez segít a működés átlátásában, az eszközök határainak megértésében. Megismerni és kipróbálni az eszközöket, beépíteni a folyamatokba azokat, amik valóban segítenek. A gombamód szaporodó eszközök között egyre értékesebb annak ismerete, hogy milyen feladatra mi a legalkalmasabb és hogyan kell hatékonyan használni. Próbálkozni kell, amiben az is benne van, hogy hibázol és tanulsz belőle.
De ezzel együtt meg kell őrizni egy egészséges kételkedést, támaszkodni az emberi józan észre és puha készségekre (soft skills), mint a kommunikáció, érzelmi intelligencia, rugalmasság, kreativitás. Ezektől vagy igazán ember, ezekben tudsz a gépnél jobb lenni!
Emellett ne feledjük, hogy vannak olyan területei a fotózásnak, amelyek arról szólnak, hogy azt őrizzük meg, ami ténylegesen történt. Az esküvőnket, a családunkat, a fontos eseményeket. Hiszek benne, hogy a “mesterséges” világban is lesz piaca az igazinak, a természetesnek, és egy generált világhoz képest már egy erősen utómunkázott kép is az előbbi kategóriába tartozik. Az utómunkára egyre kevesebb gondod lesz, ha eddig is csak púp volt a hátadon.
Amit pedig érintetlenül hagy a mesterséges intelligencia, az a fotózás élvezete, az alkotás öröme, amikor csak csodálod a fényeket és árnyékokat, amikor minden porcikáddal teljesen belefeledkezve a legjobb pillanat megörökítésén dolgozol. Ezt semmilyen gép nem veheti el tőled.