Πώς λειτουργεί η αναζήτηση νομοθεσίας στο Domicode
Υβριδική αναζήτηση με TF-IDF, vector embeddings και reranker. Πώς το Domicode βρίσκει τη σωστή απάντηση σε 38.000+ κανονιστικά τμήματα.
Το πρόβλημα
Ένας μηχανικός σχεδιάζει ένα κτίριο κατοικιών 10 ορόφων. Χρειάζεται να ελέγξει αν συμμορφώνεται με τον ΚΕΝΑΚ (ενεργειακή απόδοση), τον κανονισμό πυρασφάλειας (τι σημαίνει για τις εξόδους κινδύνου), και τον ΝΟΚ (αν τα ύψη δωματίων είναι σωστά). Σήμερα, αυτό σημαίνει:
- Αναζήτηση σε τουλάχιστον 3 διαφορετικές πηγές νομοθεσίας
- Εξαγωγή πληροφοριών από ΦΕΚ και νόμους που είναι συχνά σε PDF
- Ερμηνεία πολύπλοκων διατάξεων που αναφέρουν άλλες διατάξεις
- Συσχέτιση πληροφοριών από διαφορετικές πηγές
- Καμία βεβαιότητα αν έχει βρει όλες τις σχετικές διατάξεις
Αυτή η διαδικασία χρειάζεται ώρες έρευνας και συχνά αναφορά σε συμβούλους νομοθεσίας.
Πώς λειτουργεί η AI αναζήτηση στο Domicode
Το Domicode χρησιμοποιεί μια σύνθετη, υβριδική αναζήτηση που συνδυάζει τρία διαφορετικά συστήματα αναζήτησης ταυτόχρονα για να βρει την ακριβή απάντηση που χρειάζεστε.
1. TF-IDF: Ακριβή ταίριασμα όρων
TF-IDF (Term Frequency, Inverse Document Frequency) είναι ένας κλασικός αλγόριθμος που δίνει βάρος στους όρους που εμφανίζονται πολλές φορές σε ένα κείμενο αλλά σπάνια στα υπόλοιπα. Στην πράξη:
- Όταν ψάχνετε "Ν.4067/2012 άρθρο 11", το σύστημα βρίσκει ακριβώς εκείνη τη διάταξη
- Όταν αναζητάτε "συντελεστής δόμησης", βρίσκει όλα τα σημεία του κειμένου που αναφέρουν αυτόν τον όρο
- Δίνει μεγάλη σημασία σε σπάνιες αλλά σχετικές κλειδωτικές λέξεις
Αυτό είναι χρήσιμο όταν ξέρετε ακριβώς τι ψάχνετε και θέλετε κάποια συγκεκριμένη παραπομπή.
2. Vector embeddings: Σημασιολογική κατανόηση
Vector embeddings είναι ένα προηγμένο σύστημα που κατανοεί το νόημα, όχι απλώς τις κλειδωτικές λέξεις. Ο αλγόριθμος:
- Μετατρέπει κάθε κανονιστικό τμήμα σε έναν "χάρτη νοήματος" (ένα διάνυσμα υψηλών διαστάσεων)
- Κάνει το ίδιο με την ερώτησή σας
- Συγκρίνει τις δύο χάρτες και βρίσκει τα πιο κοντινά αποτελέσματα νοήματος
Για παράδειγμα:
- Αν ρωτήσετε "πόσο μπορώ να χτίσω σε οικόπεδο 500 τ.μ.;", το σύστημα κατανοεί ότι ζητάτε πληροφορίες για τον συντελεστή δόμησης, ακόμα κι αν δεν χρησιμοποιείτε ακριβώς αυτή τη λέξη
- Αν ρωτήσετε "ποιες είναι οι απαιτήσεις για τις έξοδος σε περίπτωση πυρκαγιάς", συγχέει αυτό με τις διατάξεις πυρασφάλειας
Αυτό είναι ιδιαίτερα χρήσιμο για φυσικές ερωτήσεις σε ελληνικά όπως θα τις έθετε σε έναν συνάδελφο.
3. Reranker: Βελτιστοποίηση αποτελεσμάτων
Μετά από αναζήτηση με TF-IDF και embeddings, το σύστημα έχει έναν μεγάλο αριθμό υποψηφίων αποτελεσμάτων. Το reranker είναι ένα εξειδικευμένο μοντέλο που:
- Ταξινομεί τα αποτελέσματα ξανά βάσει της πραγματικής σχετικότητας τους με την ερώτησή σας
- Τοποθετεί τα πιο σημαντικά αποτελέσματα στην κορυφή
- Αγνοεί τυχόν παραπλανητικές ταιριάσματα
Η βάση δεδομένων πίσω από τη σκηνή
Το σύστημα αναζήτησης είναι τόσο καλό γιατί πηγαίνει πίσω σε μια τεράστια, δομημένη βάση δεδομένων:
- 913 επίσημες πηγές: Κάθε νόμος, ΠΔ, εγκύκλιος και οδηγία έχει εξαχθεί από το et.gr και έχει κατηγοριοποιηθεί
- 38.429 κανονιστικά τμήματα: Κάθε άρθρο, κεφάλαιο και παράγραφος έχει εξαχθεί ξεχωριστά με πλήρη μεταδεδομένα (αριθμός νόμου, ημερομηνία ισχύος, σχετικές διατάξεις)
- 718 νόμοι και κανονισμοί: Από τον ΝΟΚ (Ν.4067/2012) μέχρι τον ΚΕΝΑΚ και τις πιο πρόσφατες τροποποιήσεις
- 37 κατηγορίες οικοδομικής νομοθεσίας: Δόμηση, χρήσεις γης, ενεργειακή απόδοση, πυρασφάλεια, προσβασιμότητα, περιβάλλον, και πολλά άλλα
Κάθε κανονιστικό τμήμα αποθηκεύεται με:
- Το πλήρες κείμενο
- Τον νόμο και το άρθρο από το οποίο προέρχεται
- Τη σχετική ημερομηνία έναρξης ισχύος
- Τις αναφορές σε άλλες διατάξεις (crosslinks)
- Τις σχετικές εγκυκλίους και ερμηνευτικές αποφάσεις
Για σαρωμένα έγγραφα και παλαιά ΦΕΚ, το σύστημα χρησιμοποιεί OCR (Optical Character Recognition) για να εξάγει το κείμενο με ακρίβεια.
Πρακτικά παραδείγματα ερωτήσεων
Παράδειγμα 1: Συντελεστής δόμησης
Ερώτηση: "Σε οικόπεδο 1.000 τ.μ. με συντελεστή δόμησης 1,2, πόσα τ.μ. μπορώ να χτίσω;"
Πώς δουλεύει:
- Το TF-IDF βρίσκει όλα τα άρθρα του ΝΟΚ που αναφέρουν "συντελεστής δόμησης"
- Το embedding κατανοεί ότι ζητάτε υπολογισμό και όχι απλώς τον ορισμό
- Το reranker τοποθετεί στην κορυφή το άρθρο που εξηγεί ακριβώς πώς υπολογίζεται η δομήσιμη επιφάνεια
- Λαμβάνετε: "Ο συντελεστής δόμησης (ΣΔ) πολλαπλασιάζεται με την επιφάνεια του οικοπέδου. Επομένως: 1.000 τ.μ. x 1,2 = 1.200 τ.μ. δομήσιμη επιφάνεια" (Ν.4067/2012 άρθρο 23)
Παράδειγμα 2: Πυρασφάλεια στα κτίρια κατοικιών
Ερώτηση: "Ποια είναι η ελάχιστη απόσταση μεταξύ δύο εξόδων κινδύνου σε ένα κτίριο κατοικιών;"
Πώς δουλεύει:
- Το TF-IDF αναζητά "έξοδος κινδύνου" και "απόσταση"
- Το embedding κατανοεί ότι ζητάτε κανόνες σχεδιασμού και όχι γενικές πληροφορίες
- Το reranker τοποθετεί στην κορυφή τις διατάξεις του κανονισμού πυρασφάλειας που ορίζουν τις απόστάσεις
- Λαμβάνετε: "Για κτίρια κατοικιών, οι έξοδοι κινδύνου πρέπει να απέχουν όχι περισσότερο από 40 μέτρα μεταξύ τους ή από τα επιμέρους χώρια" (με την ακριβή αναφορά στον κανονισμό πυρασφάλειας)
Παράδειγμα 3: Ύψος δωματίων
Ερώτηση: "Ποιο είναι το ελάχιστο ύψος ενός κατοικίστικου δωματίου;"
Πώς δουλεύει:
- Το TF-IDF βρίσκει όλα τα άρθρα που αναφέρουν "ύψος δωματίου" ή "ύψος χώρου"
- Το embedding αναγνωρίζει ότι ζητάτε τεχνικές προδιαγραφές και όχι αρχιτεκτονικές συμβουλές
- Το reranker τοποθετεί το Άρθρο 18 του ΝΟΚ στην κορυφή, που ορίζει ελάχιστα ύψη (συνήθως 2,50 μ. για κύρια δωμάτια)
- Λαμβάνετε τη διάταξη με όλες τις εξαιρέσεις και τις ειδικές περιπτώσεις
Μορφή παραπομπών και απαντήσεων
Κάθε απάντηση που λαμβάνετε περιλαμβάνει:
- Το άμεσο κείμενο από τη νομοθεσία: Τι ακριβώς λέει ο νόμος
- Την πηγή: Ποιος νόμος, ποιο άρθρο, ποιο ΦΕΚ (π.χ. "Ν.4067/2012 Άρθρο 23, ΦΕΚ 20/2012")
- Τις σχετικές διατάξεις: Άλλα άρθρα που σχετίζονται με την απάντησή σας
- Τη σημερινή ισχύ: Αν η διάταξη έχει τροποποιηθεί, σας ενημερώνει
Σύγκριση με τη χειροκίνητη έρευνα
Ας δούμε πώς διαφέρει αυτό από τη συνήθη προσέγγιση:
Παλιός τρόπος:
- Κατεβάστε τον ΝΟΚ από et.gr (PDF, 200+ σελίδες)
- Ψάξτε τη λέξη "δόμηση" με Ctrl+F (100+ αποτελέσματα)
- Διαβάστε κάθε αποτέλεσμα για να δείτε αν σχετίζεται
- Βρείτε τα σχετικά άρθρα και διαβάστε τις αναφορές τους
- Συμβουλευθείτε ένα κανονισμό πυρασφάλειας (άλλο PDF)
- Συνδυάστε τις πληροφορίες χειροκίνητα
- Ελπίστε ότι δεν λάβατε υπόψη κάποια νέα τροποποίηση
Με το Domicode:
- Ρωτήστε στα ελληνικά ό,τι θέλετε να ξέρετε
- Λαμβάνετε απάντηση σε δευτερόλεπτα
- Με πλήρεις παραπομπές
- Με σχετικές διατάξεις αυτόματα συμπεριλαμβανόμενες
Γιατί αυτό είναι σημαντικό για τους μηχανικούς
Μεταφράζοντας τα τεχνικά, σημαίνει:
- Ταχύτητα: Αντί για ώρες έρευνας, λάβετε απάντηση σε λίγα δευτερόλεπτα
- Ακρίβεια: Το σύστημα δεν θα χάσει μια σχετική διάταξη γιατί δεν θα το ξεχάσατε να ψάξετε
- Νομιμότητα: Κάθε απάντηση έχει αναφορές, οπότε μπορείτε να αποδείξετε ότι ακολουθείτε τη νομοθεσία
- Ανταγωνιστικότητα: Ενώ οι άλλοι μηχανικοί ψάχνουν σε PDFs, εσείς ήδη πράττετε
Η αναζήτηση είναι η καρδιά του Domicode, και είναι σχεδιασμένη με τις ανάγκες των μηχανικών υπόψιν.
Δοκιμάστε δωρεάν το Domicode
Αναζητήστε κανονισμούς σε φυσική γλώσσα. 913 πηγές, 38.000+ τμήματα νομοθεσίας.
Δοκιμάστε τώρα