DBM blog - laatste entry
27-06-2011 - IJdele Mannen
Deze column gaat over een menselijk ICT-onderwerp: mijzelf. U moet weten dat ik recent 50 ben geword ...
Lees meer
DBM activiteiten
30 mei t/m 1 juni 2012, Mastering the Requirements Process I
5 juni 2012, BPMN 2.0 syntax, methodieken en positionering
6 juni 2012, BPMN 2.0 in de praktijk
7 juni 2012, Data Virtualisatie voor Agile Business Intelligence Systemen NIEUW
14 juni 2012, Trends in BPM 2012
3 t/m 5 september 2012, Mastering the Requirements Process I
3 en 4 oktober 2012, Pragmatisch identificeren, modelleren, schatten en testen van smart use cases
9 en 10 oktober 2012, Definiëren en uitvoeren van een informatie strategie met MDM en Governance

DBM poll
DBM-poll Intelligente search-technologie zal de traditionele query verdringen.
 
16%
 
21%
 
56%
 
7%
Database Tools OLAP

Detail
Rick van der Lans 
Rick van der Lans Rick F. van der Lans is onafhankelijk adviseur, docent, auteur en spreker over datawarehousing, business intelligence, applicatie-integratie en databasetechnologie. Hij heeft hij vele grote (inter)nationale bedrijven geadviseerd inzake datawarehouse-architectuur en toolkeuze. Hij is voorzitter van het Independent Analyst Platform en auteur van diverse artikelen in toonaangevende vakbladen en verscheidene boeken, waaronder het populaire SQL Leerboek.

30 september 2010 - Graph analytics

De gebruikers van Business Intelligence systemen kunnen momenteel kiezen uit een breed scala aan producten waarmee ze rapporten kunnen maken en analyses kunnen uitvoeren. Deze producten variëren van rechttoe rechtaan rapportageproducten via interactieve online analytical processing tools tot geavanceerde statistische en datamining producten. De bedoeling van al deze producten is dat ze het beslissingsproces van de gebruikers verbeteren. Ze helpen door gegevens onder andere te filteren, te sommeren, te groeperen en door te voorspellen en de resultaten grafisch te presenteren.
 
Maar er zijn zaken waartoe deze producten niet in staat zijn en dat is, onder andere, het analyseren van gegevens wanneer deze als een graaf of netwerk gestructureerd zijn en wanneer de analyse vereist dat die netwerkstructuur bewandeld moet worden. Stel eens voor dat een manager van een sociaal netwerk website, zoals Facebook of LinkedIn, wil weten wie de centrale leden van het totale netwerk zijn, waarbij de term centraal lid gedefinieerd is als een lid dat de meeste korte paden heeft naar de andere leden. Dit probleem kan niet opgelost worden door simpelweg gegevens bij elkaar op te tellen noch heeft het iets te doen met het voorspellen met behulp van statistische modellen. Nee, wat hier nodig is, is een product dat van lid naar lid door het netwerk kan wandelen. Maar dit is een eigenschap die de meeste bekende analytische en rapportageproducten niet ondersteunen.
 
We geven nog een ander voorbeeld. Met veel rapportageproducten zal een luchtvaartmaatschappij kunnen bepalen hoeveel vluchten per dag vanuit een specifiek vliegveld vertrekken. En als per vlucht de zogenaamde load factor (percentage stoelen verkocht) bekend is, kunnen ze ongetwijfeld de gemiddelde load factor voor vluchten van Amsterdam naar Londen berekenen. Beschikken ze over de geschikte statistische producten, dan kunnen ze zelfs laten voorspellen wat de load factor voor de komende maand zal zijn. Ze kunnen ook dashboards ontwikkelen die live de gemiddelde load factor voor alle vluchten tonen.
 
Maar wat al deze producten niet kunnen is bepalen wat de twee goedkoopste of de vier kortste vluchten van Amsterdam naar New York zijn. En als we weer het voorbeeld van een sociaal netwerk nemen, deze producten kunnen niet bepalen welke andere leden een specifiek lid waarschijnlijk wel kent, maar nog niet mee verbonden is. Het zal ook lastig zijn voor een telefoonmaatschappij om te bepalen welke klanten mogelijkerwijs andere klanten beïnvloeden om bij de huidige provider te blijven of over te stappen.
 
De bovengenoemde problemen behoren tot het domein van graph analytics, ofwel het analyseren van grafen (netwerken). Graph analytics is een speciale vorm van analytics die al lang bestaat. In feite gaat de geschiedenis van graph analytics en de onderliggende grafentheorie terug tot aan de eerste helft van de 18de eeuw. Tegenwoordig bestaan er krachtige producten en databaseservers speciaal ontwikkeld voor graph analytics. Het speciale aan deze producten is dat ze grafen bestaande uit honderden miljoenen nodes kunnen verwerken en ze snel kunnen analyseren. Ze ondersteunen de algoritmes om bepaalde typische graafproblemen op te lossen.
 
De BI-wereld is helaas nog niet zo bekend met het analyseren van grafen. Niet dat het onderwerp nieuw is, maar het wordt nog maar zelden toegepast in Business Intelligence systemen. En dat is jammer, want graph analytics heeft veel te bieden en de producten en databaseservers zijn er klaar voor. Graph analytics kan ook in veel omgevingen toegepast worden. Overheidsinstanties, financiële instellingen, distributie- en transportbedrijven, retailers, telefoonmaatschappijen en eigenaren van websites kunnen allemaal zeer nuttig van deze mogelijkheid gebruik maken.
 
Tamelijk recent is een nieuwe generatie databaseservers geïntroduceerd waar naar gerefereerd wordt met de intrigerende term NoSQL databaseservers. Let wel, dit is niet een homogene groep van producten, maar een groep databaseservers met zeer uiteenlopende mogelijkheden en toepassingsgebieden. Wat ze gemeen hebben is dat ze SQL niet als de primaire databasetaal zien. Sommige ondersteunen SQL geheel niet en andere ondersteunen het slechts als secundaire taal en dan soms slechts een subset van SQL. Enkele van deze NoSQL databaseservers kunnen geclassificeerd worden als graph databaseservers: producten die speciaal voor het ondersteunen van graph analytics ontwikkeld zijn. Voorbeelden hiervan zijn Objectivity’s InfiniteGraph, AllegroGraph RDFStore, Neo4j en vertexdb. Als we de eerstgenoemde als voorbeeld nemen, dit product ondersteunt veel vormen van graph analytics, waaronder single path analysis, shortest path analysis, optimal path analysis, path existence analysis en vertex centrality analysis.
 
Samenvattend; de huidige producten die ontwikkeld zijn voor graph analytics zijn klaar voor het grote werk. Vooral de op databaseservers gebaseerde producten zijn in staat om zeer grote grafen bestaande uit miljoenen nodes te analyseren. Deze vorm van analytics verdient daarom meer aandacht van alle BI-specialisten. De grote uitdaging is om te bepalen waar het binnen een organisatie nuttig ingezet kan worden. Waar kan graph analytics het huidige palet van BI-producten verrijken?

Deze column verscheen eerder in Database Magazine 6-2010



Permalink | Trackback | Print | E-mail

Reacties op deze blog
Er zijn nog geen reacties.
Reageer
Wilt U een reactie plaatsen op dit bericht? Log dan in op deze website. Heeft U dat nog niet eerder gedaan? Registreer U dan eerst.
DBM nieuws || alle items
14-02-2012 - Information Builders opnieuw in leiderskwadrant Business Intelligence Platforms
De evaluatie is gebaseerd op ‘Ability to Execute’ en ‘Completeness of Vision’.
Lees meer
08-02-2012 SAP maakt real-time analytics beschikbaar voor het ... 
27-01-2012 Software AG rapporteert stabiele omzet en winst in b... 
26-01-2012 Logica maakt big data razendsnel beschikbaar via sma... 
26-01-2012 Zakelijke beslissers zijn niet zeker over de informa... (1)
25-01-2012 Strategische samenwerking voor SAP-totaaloplossingen 
17-01-2012 Progress Software: cloud, social collaboration en da... 
Lees meer
DBM Video|| alle items
Data Vault

Tijdens het BI-event 2011 vertelt Hans Hultgren , zakenpartner van Dan Linstedt en directeur van de Genesee Academy, over het succes van Data Vault in Nederland.
 
DBM artikelen || alle items || zoeken
Geen leesweergave beschikbaar27-09-2011 - Trends en ontwikkelingen in Business Analytics

Business Analytics werd tot op heden vooral gebruikt om gestructureerde interne informatie te analyseren, zodat ontwikkelingen in het verleden konden worden verklaard. Het is vaak juist door het gebruiken van externe en ongestructureerde informat ... Lees meer

Geen leesweergave beschikbaarResultaten Business Analytics Survey
Geen leesweergave beschikbaarIdentificeren, Stimuleren en Organiseren
Geen leesweergave beschikbaarPlaatjes halen waarde uit data
Geen leesweergave beschikbaarWeb Analytics: een ondergeschoven kind?
Geen leesweergave beschikbaarHet datawarehouse geen database meer?
Geen leesweergave beschikbaarTom Davenport on Analytics
Geen leesweergave beschikbaarCertificaat van Onvermogen
Geen leesweergave beschikbaarBezoekerservaringen op maat
DBM bloggers || alle items
BI-Matrix
Categorieën
Organisaties

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
Database Tools Databasemanagementsystemen
DBM personalia || alle items
BI-Platform nieuws
AnalyticsDB-Matrix
Kenmerken
Producten

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
ETL-Matrix
Selectiecriteria
Producten

U kunt ook het selectietraject doorlopen.
Klik hier om het selectietraject te starten.
DBM zoeken

Laatste editie
DBM agenda
30 mei t/m 1 juni 2012, Mastering the Requirements Process I
5 juni 2012, BPMN 2.0 syntax, methodieken en positionering
6 juni 2012, BPMN 2.0 in de praktijk
7 juni 2012, Data Virtualisatie voor Agile Business Intelligence Systemen NIEUW
14 juni 2012, Trends in BPM 2012
Lees meer

Klik hier om een evenement op te voeren.
DBM bloggers
DBM Categories
Geen categorieën gevonden.
Blog jaren
DBM sponsor
Database Tools Databasebeheer
DBM Foto
DBM opleidingen
Geen opleidingen gevonden.

Klik hier om een opleiding te plaatsen.
Database Tools Datawarehousing