import dependencies:
<pre><code class="lang-plaintext">import nltk
from collections import Counter
from nltk.lm.preprocessing import flatten
from nltk.util import everygrams
import pandas as pd
</code></pre>
prep dataset:
<pre><code class="lang-plaintext">df = pd.DataFrame(
 [
 ["i go to school every day",22,"male"],
 ["he goes to school every day",35,"male"],
 ["they go to school every day",58,"female"],
 ],
 columns=["text","Age","Sex"]
)
df
</code></pre>
dataset output:
<img src="https://cdn.hashnode.com/res/hashnode/image/upload/v1698440711994/73740517-cb39-4cc7-b66d-bb0489a39022.png" alt class="image--center mx-auto" />
create dataframe:
<pre><code class="lang-plaintext">df['gramx']=[list(everygrams(s.split(), min_len=1, max_len=3)) for s in df['text']]

df
</code></pre>
dataframe output:
<img src="https://cdn.hashnode.com/res/hashnode/image/upload/v1698440897762/f95d31b3-cd6e-4020-8b9e-7435c755c58f.png" alt class="image--center mx-auto" />
create count_gramx:
<pre><code class="lang-plaintext">count_gramx= Counter(list(flatten([list_item for list_item in df['gramx']])))
count_gramx
</code></pre>
count_gram output:
<img src="https://cdn.hashnode.com/res/hashnode/image/upload/v1698440798951/92c7d8cc-ecd4-4440-9f66-8464f45a13b7.png" alt class="image--center mx-auto" />
count_gram output:
<img src="https://cdn.hashnode.com/res/hashnode/image/upload/v1698441005108/709f1dbe-93ed-4930-9de9-72611b545112.png" alt class="image--center mx-auto" />

import dependencies:

```plaintext
import nltk
from collections import Counter
from nltk.lm.preprocessing import flatten
from nltk.util import everygrams
import pandas as pd
```

prep dataset:

```plaintext
df = pd.DataFrame(
    [
    ["i go to school every day",22,"male"],
    ["he goes to school every day",35,"male"],
    ["they go to school every day",58,"female"],
    ],
    columns=["text","Age","Sex"]
)
df
```

dataset output:

![](https://cdn.hashnode.com/res/hashnode/image/upload/v1698440711994/73740517-cb39-4cc7-b66d-bb0489a39022.png align="center")

create dataframe:

```plaintext
df['gramx']=[list(everygrams(s.split(), min_len=1, max_len=3)) for s in df['text']]

df
```

dataframe output:

![](https://cdn.hashnode.com/res/hashnode/image/upload/v1698440897762/f95d31b3-cd6e-4020-8b9e-7435c755c58f.png align="center")

create count\_gramx:

```plaintext
count_gramx= Counter(list(flatten([list_item for list_item in df['gramx']])))
count_gramx
```

count\_gram output:

![](https://cdn.hashnode.com/res/hashnode/image/upload/v1698440798951/92c7d8cc-ecd4-4440-9f66-8464f45a13b7.png align="center")

count\_gram output:

![](https://cdn.hashnode.com/res/hashnode/image/upload/v1698441005108/709f1dbe-93ed-4930-9de9-72611b545112.png align="center")

EveryGrams