1. Πειραματική αξιολόγηση τεχνολογιών μεγάλου όγκου δεδομένων
Στα πλαίσια της διπλωματικής αυτής θα αξιολογηθούν πειραματικά πλατφόρμες επεξεργασίας δεδομένων μεγάλου όγκου όπως τα ακόλουθα:
- Apache Tez – http://tez.apache.org/
- Apache Spark – https://spark.apache.org/
- Apache™ Hadoop – http://hadoop.apache.org/
- Apache Drill – http://incubator.apache.org/drill/
- Apache Storm – https://storm.incubator.apache.org/
- Apache Samza – http://samza.incubator.apache.org/
- Apache Giraph – http://giraph.apache.org/
- Impala – http://www.cloudera.com/content/cloudera/en/products-and-services/cdh/impala.html
Οι παραπάνω πλατφόρμες θα αξιολογηθούν σε μία από τις παρακάτω θεματικές ενότητες:
- Αλγόριθμοι εξόρυξης γνώσης: ομαδοποίηση αντικειμένων, εξαγωγή κανόνων συσχέτισης
- Αλγόριθμοι επεξεργασίας κειμένων: εύρεση προτύπων, summarization κ.α.
- Αλγόριθμοι επεξεργασίας γράφων
- κ.α.
Σχετικές Αναφορές:
- hortonworks – http://hortonworks.com/
- mapr – https://www.mapr.com/
- cloudera – http://www.cloudera.com/content/cloudera/en/home.html
2. Πειραματική αξιολόγηση τεχνολογιών συστημάτων διαχείρισης βάσεων δεδομένων νέας γενιάς
Στα πλαίσια της διπλωματικής αυτής θα αξιολογηθούν πειραματικά συστήματα διαχείρισης βάσεων δεδομένων όπως τα ακόλουθα:
- Column Store
- https://cassandra.apache.org
- Document Store
- http://www.mongodb.org/
- http://couchdb.apache.org/
- Key Value
- http://redis.io/
- http://www.oracle.com/technetwork/database/database-technologies/berkeleydb/overview/index.html
- Graph
- http://www.neo4j.org/
- http://research.microsoft.com/en-us/projects/trinity/
- http://giraph.apache.org/
- NewSQL
- http://www.nuodb.com/
- http://voltdb.com/
Οι παραπάνω πλατφόρμες θα αξιολογηθούν σε μία από τις παρακάτω θεματικές ενότητες:
- εκτέλεση απλών ερωτημάτων (select/where, aggregates)
- εκτέλεση ερωτημάτων σύνδεσης (joins)
- εκτέλεση σύνθετων ερωτημάτων αναζήτησης λέξεων κλειδιών και geolocation
- κ.α.
Σχετικές Αναφορές:
- http://en.wikipedia.org/wiki/NoSQL
- http://nosql-database.org/
- http://en.wikipedia.org/wiki/NewSQL