JeanWM Geplaatst: 18 februari 2006 Delen Geplaatst: 18 februari 2006 Ik probeer beide waarden te berekenen maar zie door de letters de woorden niet meer. We praten over een willekeurige opgegeven tekst in een tekstveld, die uit 1 of verschillende zinnen kan bestaan. Fog Index = (het gemiddeld aantal woorden in een zin / het percentage van gebruikte woorden met 3 of meer klinkers) x 0.4 Lexical Density = (het aantal verschillende gebruikte woorden in een zin / het totaal aantal woorden) x 100. Wie wil/kan hier even mee over brainstormen ? AUB. we blijven even in FM 6 met het geheel. Quote Link naar reactie
0 Koen Van Hulle Geplaatst: 18 februari 2006 Delen Geplaatst: 18 februari 2006 Dat zal scripten worden en loopen. Maar het blijft knap lastig, zeker in 6. Koen Quote Link naar reactie
0 JeanWM Geplaatst: 19 februari 2006 Auteur Delen Geplaatst: 19 februari 2006 Knap lastig is een deel van de uitdaging... Scripten, ja , waarschijnlijk voor een deel. Loopen, daar raak ik je kwijt Koen. Ik blijf eigenlijk toch in 1 record. Voorlopig heb ik volgende berekeningen: 1. Een totalWordCount 2. Een totalUniqueWords 3. Een countSentences 4. Een AVGWordsSentence 5. Een count LetterPerWord 6. Eenn countVowelPerWord Om van daaruit (met nog wat meer) de Fog en de Density te berekenen. (berekening heb ik nog niet) Maar steeds van 1 invoerveld per record. Het is te vergelijken met een student die een zin ingeeft in een veld, knoppeke drukt en de berekening wordt gemaakt. Eigenlijk kunnen we volstaan met 1 record en het tekstveld moet nog eens niet een global zijn. Kan leeggemaakt worden voor er een nieuwe berekening gemaakt wordt, maar zover zijn we nog niet. Om nu niet altijd alles opnieuw te moeten 'aanmaken' denk ik aan een systeem om alle nieuw gebruikte woorden in een afzonderlijk bestandje te stoppen, en daar de berekening van letters per woord en klinkers per woord te laten gebeuren. Bij de ingave van een nieuwe zin zou dan een controle gedaan worden op het aanwezig zijn van ieder woord in de lijst. Aanwezig = geen recordaanmaak, Niet aanwezig = recordaanmaak. Dat geeft dan ook nog het voordeel dat er bijna automatisch een 'woordenlijst' wordt aangemaakt, waarmee ik later nog vanalles kan aanvangen. Per slot van rekening vind je niet snel een woordenlijst waar de 'vervoeging' al heeft plaatsgevonden....(enkel een brainstormidee). In hoeverre het geheel onderhevig zal zijn aan vertraging....daar heb ik even het raden naar.... Quote Link naar reactie
0 JeanWM Geplaatst: 19 februari 2006 Auteur Delen Geplaatst: 19 februari 2006 Yep Koen, ik ben er weer bij. De loop in de script is waarschijnlijk voor de behandeling van de woorden etc. Denk toch dat ik even 'afstand' van scherm en toetsenbord moet nemen. Als ik nu al de meest elemantaire zaken al niet onmiddellijk snap...... Quote Link naar reactie
0 Koen Van Hulle Geplaatst: 19 februari 2006 Delen Geplaatst: 19 februari 2006 Ik bedoelde inderdaad loopen doorheen je woorden, niet doorheen je records. Aan je lijst van calculaties te zien ben je al aardig op weg. Koen Quote Link naar reactie
0 JeanWM Geplaatst: 19 februari 2006 Auteur Delen Geplaatst: 19 februari 2006 ...aardig wel, maar nr 5 en 6 wil maar niet volledig lukken... Enig voorstel....¿¿ TIA Quote Link naar reactie
0 Koen Van Hulle Geplaatst: 19 februari 2006 Delen Geplaatst: 19 februari 2006 5. Length(word) zou moeten het aantal karakters weergeven. 6. Ik zou elke mogelijke vowel vervangen door een "_" met de substitute functie en dan het aantal "_" tellen met de PatternCount. Koen Quote Link naar reactie
0 JeanWM Geplaatst: 22 februari 2006 Auteur Delen Geplaatst: 22 februari 2006 Bij 5. dien ik dus ook alle leestekens buiten beschouwing te laten, zoals komma, punt, spatie enz., vermits bij Lenght de spaties en de punctuations worden meegeteld. Wat zou het snelst gaan, script of calculatie ? Ieder woord in een veld, of een return delimited lijst en vandaaruit vertrekken ? Ik drop nu al alle woorden in een return delimited veld.... Quote Link naar reactie
Vraag
JeanWM
Ik probeer beide waarden te berekenen maar zie door de letters de woorden niet meer.
We praten over een willekeurige opgegeven tekst in een tekstveld, die uit 1 of verschillende zinnen kan bestaan.
Fog Index = (het gemiddeld aantal woorden in een zin / het percentage van gebruikte woorden met 3 of meer klinkers) x 0.4
Lexical Density = (het aantal verschillende gebruikte woorden in een zin / het totaal aantal woorden) x 100.
Wie wil/kan hier even mee over brainstormen ?
AUB. we blijven even in FM 6 met het geheel.
Link naar reactie
7 antwoorden op deze vraag
Aanbevolen berichten
Doe mee aan dit gesprek
Je kunt dit nu plaatsen en later registreren. Indien je reeds een account hebt, log dan nu in om het bericht te plaatsen met je account.