Adatmenedzsment újdonságok 2025 őszén – 1. rész
október 29, 2025

Olvasási idő: 5 perc

A 2025-ös ősz nem csupán inkrementális frissítéseket hozott az adatmenedzsment világába, de egy jelentős iparági fordulópontnak is tanúi lehetünk. Két meghatározó (mega)trend közeledik egymáshoz, amelyek alapjaiban formálhatják át a piacot.

Az első és legfontosabb trend a mesterséges intelligencia (MI) kézzelfogható és gyakorlati alkalmazása. A kezdeti kísérletezések után az AI mára az adatmenedzsment stratégiák egyik sarokkövévé vált. A fókusz az beágyazott, gyakorlati intelligenciára helyeződött, amely automatizálja az olyan komplex feladatokat, mint az adatok tisztítása, átalakítása és osztályozása, miközben javítja a felhasználói interakciókat és a működési hatékonyságot. Megjelentek az úgynevezett „ágens MI” (agentic AI) rendszerek, amelyek autonóm döntéshozatalra képesek, és alapjaiban írják újra a munkafolyamatokat.

A második trend a nyílt architektúrák iparági szintű szabványosodása. A piac egyértelműen az olyan nyílt táblaformátumok, mint az Apache Iceberg és a Delta Lake felé mozdult el. Ez a fundamentális váltás szétválasztja a tárolást és a számítási kapacitást, megakadályozza a gyártói függőséget, és lehetővé teszi a data lakehouse architektúra új szabvánnyá válását.

A 2025-ös ősz legfontosabb innovációi e két trend metszéspontjában találhatók. A kereskedelmi szoftvergyártók menedzselt MI-szolgáltatásokat építenek ezekre a nyílt alapokra, míg a nyílt forráskódú közösség azokat az eszközöket biztosítja, amelyekkel a vállalatok testreszabott, intelligens és nagyobb kontrollt biztosító platformokat hozhatnak létre. Ez a kettősség adja a jelentésünk gerincét.

 

Kereskedelmi ETL platformok innovációi

A vezető kereskedelmi szoftvergyártók az iparági trendeket menedzselt, nagyvállalati szintű megoldásokba csomagolják. Az átfogó téma az olyan komplex, MI-vezérelt platformok felé való elmozdulás, amelyek elrejtik a bonyolultságot a felhasználók elől.

Informatica: A vállalati AI asszisztensek térnyerése

Az Informatica 2025  – Az Informatica egy amerikai szoftvercég, amelyet 1993-ban alapítottak, és amelynek központja a kaliforniai Redwood Cityben található. – őszi frissítései a mesterséges intelligencia működőképessé tételére összpontosítanak az Intelligent Data Management Cloud (IDMC) platformon belül. A legfontosabb bejelentések az AI Agent Engineering szolgáltatás és a CLAIRE® Agents csomag.

Az AI Agent Engineering nem csupán egy újabb MI-funkció, hanem egy no-code környezet, amely lehetővé teszi intelligens, több ágensből álló MI-rendszerek építését, összekapcsolását és menedzselését. Ez egy stratégiai lépés, amely az IDMC-t az MI-vezérelt üzleti alkalmazások központi fejlesztési platformjává pozicionálja, messze túlmutatva a hagyományos ETL feladatokon. A CLAIRE Agentsek speciális digitális asszisztensek, amelyeket olyan komplex adatmenedzsment feladatok automatizálására terveztek, mint az adatminőség-ellenőrzés, adatfelderítés, adatleszármazás (lineage) és adatbetöltés. Ez az MI gyakorlati alkalmazása, amely csökkenti a manuális munkát és a rutinműveletekhez “elégetett” mély szakértelmet.

Ezeket a bejelentéseket megerősítik a kulcsfontosságú ökoszisztéma-partnerekkel kibővített együttműködések. Az NVIDIA-val való integráció lehetővé teszi a gyártási szintű MI-ágensek építését az NVIDIA AI Enterprise platformon. Az AWS, a Databricks, a Snowflake és a Microsoft partnerségek pedig mély integrációkat biztosítanak, beleértve az Amazon Bedrock alapú MI-ágenseket, a Databricks Managed Iceberg Tables támogatását, a Snowflake Cortex AI-hoz készült MI-konnektorokat és egy natív adatminőségi alkalmazást a Microsoft Fabric számára. Az Informatica 2025 második negyedéves pénzügyi eredményei a felhőalapú előfizetési bevételek erőteljes növekedését és a feldolgozott tranzakciók számának hatalmas (havi 128,2 billió) emelkedését mutatják, ami biztosítja a pénzügyi hátteret ezekhez az ambiciózus MI-kezdeményezésekhez.

Az Informatica stratégiailag átpozicionálja magát egy adatmenedzsment-eszköz szolgáltatóból egy vállalati MI-orchestrációs platformmá. A vállalat arra fogad, hogy a nagyvállalatok egy egységes, menedzselt platformot fognak előnyben részesíteni az MI-ágensek építésére és irányítására, ahelyett, hogy különböző nyílt forráskódú komponensekből állítanának össze egy megoldást. Ez a stratégia közvetlenül kezeli a nagyvállalati aggályokat, mint például az irányítást, a biztonságot és az adatleszármazást, amelyek gyakran kihívást jelentenek a széttagolt, egyedileg épített MI-megoldásokban. Ezzel az Informatica nem csupán MI-t ad az ETL-hez, hanem az adatmenedzsment alapjait használja ugródeszkaként, hogy belépjen a vállalati MI-alkalmazásfejlesztés és -irányítás magasabb értékű piacára.

Fivetran: A konnektivitás és a fejlesztői élmény erősítése

A Fivetran 2025 őszi frissítései két pragmatikus területre összpontosítanak: az adatforrások elérhetőségének bővítésére az új Lite konnektorokkal és az analitikai munkafolyamatok egyszerűsítésére a dbt Core adatmodellek egységesítésével.

Az új Lite Konnektorok bevezetése olyan forrásokhoz, mint az OpenAI, a Paylocity és a Cube, jól mutatja a SaaS-alkalmazások széles körének támogatása iránti elkötelezettséget, megkönnyítve a kisebb, niche adatforrások integrációját egyedi fejlesztés nélkül. A dbt Core-kompatibilis adatmodellek egységesítése minden konnektorhoz egyetlen, szabványosított modellbe óriási előrelépés az analitikai csapatok számára. Korábban a különálló forrás- és transzformációs modellek zavart és karbantartási terheket okozhattak; ez a változás egyetlen, analitikára kész kimenetet biztosít, felgyorsítva az utat a nyers adatoktól a betekintésig.

A platform folyamatos fejlesztései, mint például a Connector SDK hibakezelésének javítása vagy a SingleStore célrendszer béta verziójának elérhetővé tétele, a platform érettségére és megbízhatóságára való összpontosítást jelzik. A folyamatos sémafrissítések és konnektorfejlesztések (például az SAP ERP on HANA, CallRail, Azure DevOps esetében) alátámasztják a Fivetran alapvető értékajánlatát: egy karbantartásmentes adatcsővezeték biztosítását.

A Fivetran stratégiája az, hogy a modern adatverem legmegbízhatóbb és legátfogóbb „vízvezeték-rendszerévé” váljon. Ahelyett, hogy közvetlenül versenyezne az MI-orchestráció piacán, mint az Informatica, a Fivetran az ELT (Extract, Load, Transform) folyamat „EL” részének tökéletesítésére és előrecsomagolt, legjobb gyakorlatokon alapuló transzformációk („T”) biztosítására összpontosít. Ez a stratégia megerősíti az ELT paradigma értékét, ahol a transzformáció nehéz munkáját a felhőalapú adattárház végzi. A Fivetran szerepe, hogy tiszta, megbízható és jól strukturált adatokkal táplálja az adattárházat, a lehető legegyszerűbbé téve a későbbi transzformációs munkát az olyan eszközökben, mint a dbt.

    Qlik / Talend: Az intelligens, nyílt datalakehouse megszületése

    A Talend felvásárlását kihasználva a Qlik legfontosabb 2025 őszi bejelentése a Qlik Open Lakehouse általános elérhetősége, amely egy Apache Iceberg alapú menedzselt szolgáltatás. Ezt egészíti ki a generatív MI használata az adatkészletek dokumentációjának automatizálására.

    A Qlik Open Lakehouse egy menedzselt, Iceberg-alapú adattóház architektúrát biztosít az ügyfél saját AWS-környezetében. Olyan komplex feladatokat kezel, mint a nagy sebességű változásadat-rögzítés (CDC), a lassan változó dimenziók (SCD típus 1 és 2) automatikus kezelése és a fájlok optimalizálása a gyors lekérdezések érdekében. Ez a termék a nyílt adattóház trendjét teszi elérhetővé azoknak a vállalatoknak, amelyek a működési terhek nélkül szeretnék élvezni annak előnyeit. A generatív MI-alapú dokumentáció egy rendkívül gyakorlatias MI-alkalmazás: a Qlik Talend Cloud mostantól nemcsak adatkészlet-összefoglalókat, hanem az oszlopnevek és a kontextus alapján mezőszintű leírásokat is generál. Ez egy krónikus problémára – a hiányos dokumentációra – ad választ, és közvetlenül javítja az adatok felfedezhetőségét és a beléjük vetett bizalmat.

    A Qlik egy stratégiai lépést tesz, hogy a teljes adatszolgáltatási láncot lefedje, a nyers adatok betöltésétől a végső üzleti intelligenciáig, egy teljesen integrált, nyílt és intelligens platformot kínálva. Az Open Lakehouse ennek a stratégiának az architekturális központi eleme. A modern adatvermet gyakran kritizálják a széttagoltsága miatt, mivel külön eszközöket igényel az adatbetöltéshez (pl. Fivetran), a tároláshoz (pl. Snowflake), a transzformációhoz (pl. dbt) és az üzleti intelligenciához (pl. Tableau). A Qlik a felvásárlásai révén (Talend, Attunity) most már minden réteghez rendelkezik komponensekkel. A Qlik Open Lakehouse az az architekturális ragasztó, amely ezeket az elemeket egyesíti. Egy nyílt szabványra (Iceberg) építve alternatívát kínál a Snowflake-hez hasonló, zárt adattárházakkal szemben, miközben továbbra is menedzselt, felhőnatív élményt nyújt.

    A kereskedelmi platformok tehát az MI-automatizálás, a menedzselt szolgáltatások és az átfogó integrációk irányába mozdulnak el. De mi a helyzet azokkal a vállalatokkal, amelyek nagyobb kontrollt, rugalmasságot és testreszabhatóságot igényelnek? Cikksorozatunk következő, második részében a nyílt forráskódú ökoszisztéma legfrissebb fejlesztéseit vesszük górcső alá: az Apache Airflow, Apache NiFi és dbt Core innovációit, amelyek az adatmérnökök kezébe adják a teljes irányítást az adatmenedzsment folyamataik felett.

    Folytatás következik.

     

    Bővebb információkért keresse kollégánkat:

    linkedin-narancs
    Bagi Tamás üzletfejlesztési vezető
    nextentservices@nextent.hu