Fog index en Lexical density

JeanWM · 18 februari 2006

Ik probeer beide waarden te berekenen maar zie door de letters de woorden niet meer.

We praten over een willekeurige opgegeven tekst in een tekstveld, die uit 1 of verschillende zinnen kan bestaan.

Fog Index = (het gemiddeld aantal woorden in een zin / het percentage van gebruikte woorden met 3 of meer klinkers) x 0.4

Lexical Density = (het aantal verschillende gebruikte woorden in een zin / het totaal aantal woorden) x 100.

Wie wil/kan hier even mee over brainstormen ?

AUB. we blijven even in FM 6 met het geheel.

Koen Van Hulle · 18 februari 2006

Dat zal scripten worden en loopen.

Maar het blijft knap lastig, zeker in 6.

Koen

JeanWM · 19 februari 2006

Knap lastig is een deel van de uitdaging...

Scripten, ja , waarschijnlijk voor een deel.

Loopen, daar raak ik je kwijt Koen. Ik blijf eigenlijk toch in 1 record.

Voorlopig heb ik volgende berekeningen:

1. Een totalWordCount

2. Een totalUniqueWords

3. Een countSentences

4. Een AVGWordsSentence

5. Een count LetterPerWord

6. Eenn countVowelPerWord

Om van daaruit (met nog wat meer) de Fog en de Density te berekenen.

(berekening heb ik nog niet)

Maar steeds van 1 invoerveld per record.

Het is te vergelijken met een student die een zin ingeeft in een veld, knoppeke drukt en de berekening wordt gemaakt.

Eigenlijk kunnen we volstaan met 1 record en het tekstveld moet nog eens niet een global zijn. Kan leeggemaakt worden voor er een nieuwe berekening gemaakt wordt, maar zover zijn we nog niet.

Om nu niet altijd alles opnieuw te moeten 'aanmaken' denk ik aan een systeem om alle nieuw gebruikte woorden in een afzonderlijk bestandje te stoppen, en daar de berekening van letters per woord en klinkers per woord te laten gebeuren.

Bij de ingave van een nieuwe zin zou dan een controle gedaan worden op het aanwezig zijn van ieder woord in de lijst. Aanwezig = geen recordaanmaak, Niet aanwezig = recordaanmaak.

Dat geeft dan ook nog het voordeel dat er bijna automatisch een 'woordenlijst' wordt aangemaakt, waarmee ik later nog vanalles kan aanvangen. Per slot van rekening vind je niet snel een woordenlijst waar de 'vervoeging' al heeft plaatsgevonden....(enkel een brainstormidee).

In hoeverre het geheel onderhevig zal zijn aan vertraging....daar heb ik even het raden naar....

JeanWM · 19 februari 2006

Yep Koen, ik ben er weer bij.

De loop in de script is waarschijnlijk voor de behandeling van de woorden etc.

Denk toch dat ik even 'afstand' van scherm en toetsenbord moet nemen.

Als ik nu al de meest elemantaire zaken al niet onmiddellijk snap......

Koen Van Hulle · 19 februari 2006

Ik bedoelde inderdaad loopen doorheen je woorden, niet doorheen je records.

Aan je lijst van calculaties te zien ben je al aardig op weg.

Koen

JeanWM · 19 februari 2006

...aardig wel, maar nr 5 en 6 wil maar niet volledig lukken...

Enig voorstel....¿¿

TIA

Koen Van Hulle · 19 februari 2006

5. Length(word) zou moeten het aantal karakters weergeven.

6. Ik zou elke mogelijke vowel vervangen door een "_" met de substitute functie en dan het aantal "_" tellen met de PatternCount.

Koen

JeanWM · 22 februari 2006

Bij 5. dien ik dus ook alle leestekens buiten beschouwing te laten, zoals komma, punt, spatie enz., vermits bij Lenght de spaties en de punctuations worden meegeteld.

Wat zou het snelst gaan, script of calculatie ?

Ieder woord in een veld, of een return delimited lijst en vandaaruit vertrekken ?

Ik drop nu al alle woorden in een return delimited veld....

Inloggen

Fog index en Lexical density

Vraag

JeanWM

7 antwoorden op deze vraag

Aanbevolen berichten

Koen Van Hulle

JeanWM

JeanWM

Koen Van Hulle

JeanWM

Koen Van Hulle

JeanWM

Doe mee aan dit gesprek

Overig

Activiteit