Имеем датасет парафраз и векторную модель (продвинутую), которая векторизует фразы. Найдётся такая фраза, что её метрика близости в векторном пространстве с фразой, которая не является парафразом, статистически не различима с другой фразой парафразом.
Таким образом векторная модель без дообучения не сможет разделить данные тройки.