personas

Datasets for Deep learning Personas

TL;DR: These are the datasets that we've used in our fun AI side project experiment, over at https://personas.huggingface.co/

We've trained seq2seq models using DeepQA, a tensorflow implementation of "A neural conversational model" (a.k.a. the Google paper), a Deep learning based chatbot.

Datasets used

Cornell Movie Dialogs corpus
Supreme Court Conversation Data.
Ubuntu Dialogue Corpus for tech-support type discussion.
Stack Exchange Data Dump

This is an anonymized dump of all user-contributed content on the Stack Exchange network. Each site is formatted as a separate archive consisting of XML files zipped via 7-zip using bzip2 compression. Each site archive includes Posts, Users, Votes, Comments, PostHistory and PostLinks. For complete schema information, see the included readme.txt.

Attribution: cc-by-sa 3.0

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

personas

Datasets used

About

Releases

Packages

DeltaVML/personas

Folders and files

Latest commit

History

Repository files navigation

personas

Datasets used

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages