PREDICTIVE INTERNET RESOURCE REPUTATION ASSESSMENT

IPRID reputation assessment enhances cyber security. IPRIDs include IP addresses, domain names, and other network resource identities. A convolutional neural network or other machine learning model is trained with data including aggregate features or rollup features or both. Aggregate features may i...

Full description

Saved in:
Bibliographic Details
Main Authors SHAHANI, Ravi Chandru, HINES, Douglas J, REGE, Juilee, PATEL, Amar D
Format Patent
LanguageEnglish
French
Published 22.04.2021
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:IPRID reputation assessment enhances cyber security. IPRIDs include IP addresses, domain names, and other network resource identities. A convolutional neural network or other machine learning model is trained with data including aggregate features or rollup features or both. Aggregate features may include aggregated submission counts, classification counts, HTTP code counts, detonation statistics, and redirect counts, for instance. Rollup features reflect hierarchical rollups of data using value placeholders specified in IPRID templates. The trained model can predictively infer a label, or produce a rapid lookup table of IPRIDs and maliciousness probabilities. Training data may be organized in grids with rows, columns, planes, branches, and slots. Training data may include whois data, geolocation data, and tenant data. Training data tuple sets may be expanded by date or by original IPRID. Trained models can predict domain labels accurately at scale, even when most of the domains encountered have never been classified before. L'évaluation de réputation IPRID améliore la cybersécurité. Les IPRID comprennent des adresses IP, des noms de domaine et d'autres identités de ressources de réseau. Un réseau de neurones à convolution ou un autre modèle d'apprentissage machine est entraîné avec des données comprenant des caractéristiques d'agrégat ou des caractéristiques de cumul ou les deux. Les caractéristiques d'agrégat peuvent comprendre des comptages de dépôt cumulés, des comptages de classification, des comptages de code HTTP, des statistiques de détonation et des comptages de redirection, par exemple. Des caractéristiques de cumul reflètent des cumuls hiérarchiques de données à l'aide de paramètres fictifs de valeurs spécifiés dans des modèles IPRID. Le modèle entraîné peut inférer de manière prédictive un marqueur, ou produire une table de consultation rapide d'IPRID et de probabilités de malveillance. Des données d'entraînement peuvent être organisées en grilles avec des rangées, des colonnes, des plans, des branches et des fentes. Des données d'entraînement peuvent comprendre des données Whois, des données de géolocalisation et des données de locataire. Des ensembles de tuples de données d'apprentissage peuvent être étendus par date ou par IPRID d'origine. Des modèles entraînés peuvent prédire avec précision à l'échelle des marqueurs de domaine, même lorsque la plupart des domaines rencontrés n'ont jamais été classifiés avant.
Bibliography:Application Number: WO2020US54658