У меня есть один CSV-файл, который содержит 2 столбца install-id и pagename. При вводе ввода в качестве идентификатора установки он должен указывать имя страницы из модели, однако оба идентификатора установки и имя страницы имеют несколько повторяющихся значений в строках. Я успешно создал модель CoreML из MLDataTable, однако из-за дублирования строк создаваемая модель не является точной. Ниже мой код для модели и образца CSV
install-id, page-name
0EBDD0DE-DBF7-4BB9-A501-822C5F3E31A2, DashboardViewController
56F6D800-9C01-4FE1-8BC1-D93765ED0A71, SplashViewController
56F6D800-9C01-4FE1-8BC1-D93765ED0A71, SplashViewController
56F6D800-9C01-4FE1-8BC1-D93765ED0A72, LoginViewController
56F6D800-9C01-4FE1-8BC1-D93765ED0A73, DashboardViewController
import CreateML
import Foundation
let dataset = try MLDataTable(contentsOf: URL(fileURLWithPath: "/Users/Desktop/content.csv"))
let (trainingData, testingData) = dataset.randomSplit(by: 0.8, seed: 5)
let metadata = MLModelMetadata(author: "Kashif Jilani", shortDescription: "Testing model from input string.", version: "1.0")
let analysisClassifier = try MLTextClassifier(trainingData: trainingData, textColumn: "install-id", labelColumn: "page-name")
do {
try analysisClassifier.write(to: URL(fileURLWithPath:
"/Users/Desktop/Files/Content.mlmodel"),
metadata: metadata)
} catch {
print("Something went wrong, please try again!")
}