Sarcasm-detection

中文 | English

讽刺检测

1.数据集：

Sarcasm Corpus V2
使用该数据集进行训练得到模型，并对其进行检测。
若想查看讽刺语句可运行view_data
依次运行每一块即可

2.训练模型的准确率和损失：

使用train_v3.py训练模型的准确率和损失：

修正了数据集的标签

使用train_v5.py训练模型：

第一次训练
第二次训练
第三次训练

3.数据集和已经训练好的模型放在百度网盘：

链接: https://pan.baidu.com/s/1Btkmx-3orPr5zLrbz-k9qA 提取码: xnyq
原模型的名字为 my_model_old.h5
用train_v3.py训练的模型为 my_model.h5

后续更新训练的模型仍会放置在百度网盘（模型名字会使用训练的train版本来命名）

train_v5.py第一次训练即 my_model_v5_v1.h5

4.版本

python版本 3.10
numpy 1.24.4
keras 2.10.0
tensorflow-gpu 2.10.0

使用命令配置环境

pip install -r requirements.txt

更新

code1是原始版本，在使用已经训练好的模型和tokenizer时出现问题。

code1_v2已经修改了这个问题。
在predicate_v2.py中更新可输入自定义语句来判断是否讽刺。

train_v3.py中,修改了数据集标签的问题。

train_v2.py 与 train.py 的数据集的标签都存在问题
train_v3.py修改了这个问题

train_v4.py 在v3的基础上，增加了config，可通过修改config中参数修改训练轮次、数据集位置

train_v5.py 在v4的基础上，修改了模型，增加了回调函数。

使用方法

训练模型

可直接使用命令

python train_v3.py

需下载数据集，将data与train.py放在同一文件夹下。

或直接使用

python train_v4.py

可在config中修改数据集位置

讽刺判断

1.predicate.py 版本需修改代码中的 new_texts
2.predicate_v2.py 版本在运行后通过输入自定义语句来判断是否讽刺
如想结束输入使用exit结束输入，并对已输入的数据进行预测。

Name		Name	Last commit message	Last commit date
Latest commit History 53 Commits
jupyter_code		jupyter_code
train		train
LICENSE		LICENSE
README.md		README.md
README_EN.md		README_EN.md
predicate.py		predicate.py
predicate_v2.py		predicate_v2.py
requirements.txt		requirements.txt
train_v5.py		train_v5.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sarcasm-detection

中文 | English

讽刺检测

1.数据集：

2.训练模型的准确率和损失：

使用train_v3.py训练模型的准确率和损失：

使用train_v5.py训练模型：

3.数据集和已经训练好的模型放在百度网盘：

后续更新训练的模型仍会放置在百度网盘（模型名字会使用训练的train版本来命名）

4.版本

使用命令配置环境

更新

train_v3.py中,修改了数据集标签的问题。

train_v4.py 在v3的基础上，增加了config，可通过修改config中参数修改训练轮次、数据集位置

train_v5.py 在v4的基础上，修改了模型，增加了回调函数。

使用方法

训练模型

讽刺判断

About

Releases

Packages

Languages

License

WThirteen/Sarcasm-detection

Folders and files

Latest commit

History

Repository files navigation

Sarcasm-detection

中文 | English

讽刺检测

1.数据集：

2.训练模型的准确率和损失：

使用train_v3.py训练模型的准确率和损失：

使用train_v5.py训练模型：

3.数据集和已经训练好的模型放在百度网盘：

后续更新训练的模型仍会放置在百度网盘（模型名字会使用训练的train版本来命名）

4.版本

使用命令配置环境

更新

train_v3.py中,修改了数据集标签的问题。

train_v4.py 在v3的基础上，增加了config，可通过修改config中参数修改训练轮次、数据集位置

train_v5.py 在v4的基础上，修改了模型，增加了回调函数。

使用方法

训练模型

讽刺判断

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages