γεια!
Υπάρχει ελληνικός stemmer για το search του drupal;;
Δεν βρήκα κάτι που να προσφέρει λειτουργικότητα stemming (http://en.wikipedia.org/wiki/Stemming) για ελληνικά στο search του drupal, οπότε έφτιαξα το παρακάτω module http://drupal.org/project/greekstemmer. Ουσιαστικά είναι port υπάρχουσας υλοποίησης στο Drupal search.
Το search.module απαιτεί η λέξη κλειδί που βάζει ο χρήστης να είναι ακριβώς η ίδια με μια λέξη σε κάποιο node, για να επιστρέψει το node σαν αποτέλεσμα στον χρήστη. Αυτό στα ελληνικά είναι σχεδόν άχρηστο.. αφού ούτε κεφαλαία μικρά καταλαβαίνει, ούτε τόνους και φυσικά ούτε διαφορετικές μορφές τις ίδιας λέξης. Το παραπάνω module λύνει σε κάποιο βαθμό πολλά προβλήματα.
Ελπίζω να φανεί χρήσιμο..
έκανα μια δοκιμή σε 6.10. είχα δυό λέξεις Εορτασμός και εορτασμός σε κείμενα . Στην αναζήτηση μου έβγαλε και τα δύο αποτελέσματα. Με το module που προτείνεις τί άλλο θα μπορούσε να βγάλει ; πχ θα έβρισκε και το γιορτάζουμε;
α δουλεύει και σε D6? :-) μάλλον τα 2 hooks που χρησιμοποίησα δεν θα έχουν αλλάξει στο 6..
αν βάλεις "εορτασμός" στην αναζήτηση και σε ένα page υπάρχει το "γιορτάζουμε", δυστυχώς δεν θα σου επιστρέψει το node.. O stemmer κυρίως κόβει ένα αριθμό γραμμάτων από το τέλος της λέξης. Οι 2 αυτές λέξεις διαφέρουν και στα αρχικά γράμματα τους. Για να βρεθεί κάτι τέτοιο θέλει lemmatizer, για να βρεθεί το λήμμα των λέξεων.
Αλλά ο stemmer είναι χρήσιμος π.χ. αν είχαμε "υπερβολή" και "υπερβολικά".