اسم التوزيعة | DAT Linux |
نوع النظام | جنو / لينكس |
التوزيعة مبنية على أساس | Ubuntu LTS |
معمارية التوزيعة | x86_64 |
بلد منشاء التوزيعة | ===== |
نوع سطح المكتب | LXQt |
فئة التوزيعة | للصيانة |
حالة التوزيعة | نشطة |
![]() |
![]() |
![]() |
فى هذا الموضوع سوف نقوم بمراجعة الإصدار التجريبي الأول من DAT Linux، المصمم خصيصًا لعلماء البيانات.
هناك طلب كبير على علم البيانات اليوم، بما في ذلك فرص العمل والتعلم والدورات الجامعية وما إلى ذلك. إنه تيار يتعامل مع استخلاص استنتاجات ذات معنى من خلال تطبيق الخوارزميات ونماذج الذكاء الاصطناعي.
تتوفر معظم منتجات علوم البيانات التجارية اليوم من كبار اللاعبين في مجال التكنولوجيا. وتستهدف هذه المنتجات المؤسسات الكبيرة ذات الأعمال الحيوية.
لكن المئات من الأدوات والحزم والبرامج المجانية والمفتوحة المصدر متاحة للعمل في علم البيانات والتي لا يعرفها الكثيرون.
ومن ثم، فإن إعداد نظام Linux فعال بهذه الأدوات اللازمة لعمل علم البيانات يستغرق وقتًا طويلاً لأنه يتطلب القليل من البحث والتنزيل والتثبيت وما إلى ذلك.
مع أخذ ذلك في الاعتبار، تقدم توزيعة DAT Linux مجموعة كبيرة من الأدوات والبرامج المثبتة مسبقًا والمكونة مسبقًا مع أدواته الأصلية لمساعدة علماء البيانات والطلاب والمدرسين والهواة.
■ مقدمة
DAT Linux هى توزيعة Linux متخصصه فى علم البيانات وتحتوى التوزيعة على جميع أدوات وتطبيقات علوم البيانات مفتوحة المصدر المفضلة لديك في بيئة سطح مكتب جاهزة للتشغيل.
توزيعة DAT Linux هى مبنيه على توزيعة Ubuntu 22.04، لذا فهى تعتبر سهلة التثبيت والاستخدام. وتوفر لوحة تحكم DAT Linux المخصصة مركزًا شاملاً لتشغيل وإدارة العشرات من برامج علوم البيانات.
● في هذه المقالة، نستعرض DAT Linux وإصداره التجريبي.
■ مراجعة دات لينكس
● القاعدة والتصيب
الاسم “DAT” هو نسخة مجردة من كلمة “DATA”. وبما أن هدفها هو علم البيانات، فقد أصبح اسم التوزيعة هو “DAT Linux” كاختصار.
يعتمد DAT Linux في جوهره على Ubuntu LTS، أي Lubuntu 22.04 LTS اعتبارًا من إصداره 1.0b (بيتا)، وهو الإصدار المستهدف من هذه المراجعة.
يعد اختيار Lubuntu مع سطح المكتب LXQt أمرًا مثيرًا للاهتمام، ربما يكون الأداء هو الهدف من عمل علم البيانات الذي قد يتطلب موارد نظام كبيرة. ويعتبر سطح المكتب LXQt هو بيئة سطح المكتب الأكثر خفة الوزن اليوم.
● التوزيعة تاتى بحجم 3.3 جيجابايت، وهو مطابق تقريبًا لـ Ubuntu 22.04 LTS. ومع ذلك، هناك اختلاف طفيف في المثبت.
● تستخدم توزيعة DAT Linux مثبت Calamares المخصص بدلاً من مثبت Ubiquity من Ubuntu. والسبب فى ذلك، هو ان المثبت Calamares هو أفضل برنامج تثبيت متاح اليوم من حيث سهولة الاستخدام والاستقرار.
■ النظرة الأولى وسطح المكتب
تعتبر توزيعة Lubuntu خفيفة الوزن للغاية بفضل سطح المكتب LXQt ومكوناته. ويقدم سطح المكتب LXQt العديد من التطبيقات الأصلية مثل QTerminal، وPCManFM-QT file manager.
علاوة على ذلك، فإنك لا تهتم كثيرًا بموضوعات ومظهر سطح المكتب عند العمل في مشاريع علوم البيانات الجادة.
يعد سطح المكتب LXQt في DAT Linux بمثابة تجربة رائعة حيث يحتوي على قائمة التطبيقات على اليسار، وقائمة بالتطبيقات والنوافذ المفتوحة في المنتصف، وعلبة النظام على اليمين.
افتراضيًا، يقدم LXQt أربع مساحات عمل أعتقد أنها أكثر من كافية للتعمق بشكل منطقي في تطبيقات علوم البيانات الخاصة بك للعمل.
بشكل عام، إنه سطح مكتب سريع ونظيف ومثالي للعمل أو المشاريع.
■ الفرق مع لوبونتو
تختلف التطبيقات الافتراضية الموجودة على توزيعة DAT Linux عن التطبيقات الافتراضيه الموجودة على توزيعة إصدار Lubuntu الأصلي.
● أولاً، متصفح الويب الافتراضي هو LibreWolf (وليس Firefox)، وهو متصفح مجاني ومفتوح المصدر يركز على الخصوصية.
● ثانيًا، لتثبيت تطبيقات وحزم إضافية، فإنه يجلب package manager by KDE، وهى أداة مركزية لتثبيت البرامج والحزم وإزالتها وإدارتها.
● بالإضافة إلى ذلك، يقدم DAT Linux أيضًا مدير حزم The Muon package manager ويعد مدير حزم Muon أيضًا مدير حزم قويًا للبحث عن الحزم وتثبيتها. بالإضافة إلى ذلك، يمكنك بسهولة إدارة مصادر البرامج وPPAs باستخدام Muon.
● وتاتى توزيعة DAT Linux مع البرامج الإضافية الأخرى مثلا محرر Vim ومدير دفتر الملاحظات NobleNote ومشغل الوسائط VLC وXscreensaver وPicom. أيضًا، تم تثبيت LibreOffice مسبقًا في DAT Linux.
● فى توزيعة DAT Linux، لا يتم تثبيت تطبيقات Flatpak وSnap مسبقًا.
■ التطبيقات والأدوات فى توزيعة DAT Linux.
التركيز الأساسي لهذه التوزيعة ينصب على علم البيانات، لذلك تم تحميل التوزيعة بجميع التطبيقات الضرورية لهذا التخصص.
● ● ● فيما يلي قائمة التطبيقات المدعومة فى توزيعة DAT Linux:
Description | App | Icon |
Eclipse BIRT™ is an open source reporting system for producing compelling BI reports | BiRT | ![]() |
ClickHouse is an open-source column-oriented DBMS for online analytical processing | ClickHouse | ![]() |
Data Quality toolkit that allows you to profile, correct, and enrich your data | Data Cleaner | ![]() |
Datasette is a tool for exploring and publishing data visually and with SQL | Datasette | ![]() |
DB Browser for SQLite is a visual, open source tool to create, design, and edit database files compatible with SQLite | DB Browser | ![]() |
Free multi-platform database tool for developers, database administrators, analysts and all people who need to work with databases | DBeaver | ![]() |
Apache Druid is a real-time database to power modern analytics applications | Druid | ![]() |
Convenient interface to the “webtools” R package to search for datasets in –all– CRAN packages | D-Search | ![]() |
DuckDB is an in-process SQL OLAP database management system333 | DuckDB | ![]() |
EGit is an Eclipse based GUI for the Git version control system | E-Git | ![]() |
Emacs Speaks Statistics (ESS) is an add-on package for GNU Emacs to interact with statistical analysis programs such as R, S-Plus, SAS, Stata and OpenBUGS/JAGS | Emacs+ESS | ![]() |
Gephi is the leading visualization and exploration software for all kinds of graphs and networks | Gephi | ![]() |
Glue is a UI and Python library to explore relationships within and among related datasets | Glue-viz | ![]() |
Gnumeric is a spreadsheet program that is part of the GNOME Free Software Desktop Project | Gnumeric | ![]() |
gnuplot is a command-line and GUI program that can generate two- and three-dimensional plots of functions, data, and data fits | GNU Plot | ![]() |
Grafana is a popular open-source platform for data visualization and monitoring | Grafana | ![]() |
A GUI wraper for the Vim screen-based text editor program, with plugins for R installed | G-Vim | ![]() |
A command shell for interactive computing with a convenient console launcher | IPython | ![]() |
Julia is a high-level, high-performance, dynamic programming language | Julia | ![]() |
The Jupyter Notebook is a web-based interactive, scientific computing platform | Jupyter Notebook | ![]() |
JupyterLab is the latest web-based interactive development environment for notebooks, code, and data | Jupyter Lab | ![]() |
KNIME Analytics Platform is open source software for data science | KNIME | ![]() |
Free, open source and cross-platform Data Visualization and Analysis software accessible to everyone | LabPlot | ![]() |
LibreOffice Calc is the spreadsheet component of the LibreOffice software package | LibreOffice Calc | ![]() |
Luigi provides a framework to develop and manage data processing pipelines | Luigi | ![]() |
Meld is a visual file diff and merge tool | Meld | ![]() |
Metabase is an open-source business intelligence tool | Metabase | ![]() |
MOA is an open source framework for Big Data stream mining. It includes a collection of machine learning algorithms | MOA | ![]() |
OpenRefine is an open-source desktop application for data cleanup and transformation to other formats | OpenRefine | ![]() |
Orange is a powerful platform to perform data analysis and visualization | Orange | ![]() |
ParaView is an open-source, multi-platform data analysis and visualization application | Paraview | ![]() |
notebook | Pluto | ![]() |
the proprietary program SPSS | PSPP | ![]() |
QGIS is a Free and Open Source Geographic Information System | QGIS | ![]() |
Quarto® is an open-source scientific and technical publishing system built on Pandoc | Quarto | ![]() |
R is a free software environment for statistical computing and graphics | R | ![]() |
RStudio is an Integrated Development Environment (IDE) for R | R-Studio | ![]() |
Scilab is a free and open-source, cross-platform numerical computational package and a high-level, numerically oriented programming language | Scilab | ![]() |
Spyder is a free and open source scientific environment written in Python, for Python, and designed by and for scientists, engineers and data analysts | Spyder | ![]() |
Apache Superset is a modern, enterprise-ready business intelligence web application | Superset | ![]() |
Tabula is a free tool for extracting data from PDF files into CSV and Excel files | Tabula | ![]() |
Veusz is a scientific plotting and graphing program with a graphical user interface, designed to produce publication-ready 2D and 3D plots | Veusz | ![]() |
Visidata is an interactive multitool for tabular data. It combines the clarity of a spreadsheet, the efficiency of the terminal, and the power of Python, which can handle millions of rows with ease | Visidata | ![]() |
VSCodium is a community-driven, freely-licensed binary distribution of Microsoft’s editor VS Code (ready with plugins for R/RMarkdown, Python/Jupyter, Julia) | VSCodium | ![]() |
Weka is a GUI and collection of machine learning algorithms for data mining tasks | Weka | ![]() |
wxMaxima is a document based interface for the computer algebra system Maxima | WxMaxima | ![]() |
Web-based notebook that enables data-driven, interactive data analytics and collaborative documents with SQL, Scala, Python, R and more | Zeppelin | ![]() |
كما تشاهدون، يجب أن تكون القائمة أعلاه كافية لأي حالات استخدام لعلم البيانات، سواء كنت طالبًا أو مدرسًا أو مستقلاً أو محترفًا.
■ لوحة التحكم فى توزيعة DAT Linux
فكر فريق تطوير توزيعة DAT Linux أيضًا في طريقة مناسبة للعثور على هذه التطبيقات الإضافية وتشغيلها.
للقيام بذلك، فإنه يجلب لوحة تحكم DAT Linux، وهو مشغل تطبيقات قائم على الشبكة لتطبيقات علوم البيانات مصنفة حسب الوظائف في علامات تبويب منفصلة.
كما أنه يوفر لك العديد من الخيارات الإضافية لتطبيقات DAT Linux الأصلية مثل تحديث البرامج، والمراجع الخاصة بلغة البرمجة، وما إلى ذلك.
أخيرًا، ياتى مع هذا الإصدار Linux Kernel 5.15 LTS مع Python 3.10 وLXQt 0.17 – وهو الأساس فة توزيعة Ubuntu 22.04 LTS.
■ أداء التوزيعة
● مقياس أداء التوزيعة مثير للإعجاب. في حالة الخمول، يستخدم DAT Linux ما بين 500 ميجابايت إلى 700 ميجابايت من ذاكرة الوصول العشوائي (RAM)، وتكون وحدة المعالجة المركزية (CPU) في المتوسط 4٪.
والملاحظ انه يتم استهلاك معظم موارد النظام بواسطة خدمات Systemd.
● من الواضح أن المقياس يرتفع عند تشغيل العديد من تطبيقات ومتصفحات علوم البيانات.
● ومن الضروري أيضًا أن نتذكر أن معظم أعمال علم البيانات تتطلب قوة حاسوبية كبيرة. ومن ثم، فمن الأفضل دائمًا استخدام هذه التوزيعة على الأجهزة الحديثة المزودة بأحدث عائلات وحدة المعالجة المركزية.
بالإضافة إلى ما سبق، تأخذ DAT Linux حوالي 10 جيجابايت من مساحة القرص للتثبيت الافتراضي وتثبيت جميع الحزم.
■ الخلاصة
على الرغم من وجود الآلاف من التوزيعات ، فإن DAT Linux فريد من نوعها لأنها مزيج من Lubuntu LTS مع حزم Data Science فقط.
وفقًا لمعلوماتي البسيطة، فإن توزيعة Fedora هي الوحيدة التي لديها نسخة تسمى “Fedora Scientific”، والتي تتعامل بشكل أساسي مع البرامج العلمية.
ومع ذلك، كان أداء DAT Linux جيدًا من خلال تجميع جميع التطبيقات الضرورية بواجهة أمامية لإدارتها.
أحد الجوانب الرئيسية هو أن هذا التوزيعة ستوفر الوقت من تثبيت وتكوين كل هذه التطبيقات بواسطة مستخدم عام.
كما تعد قاعدة Ubuntu LTS مع سطح المكتب LXQt خيارًا مناسبًا. بخلاف ذلك، فهي توزيعة كاملة وتعمل بشكل جيد. آمل أن نخرج من النسخة التجريبية قريبًا وأن نحصل على أول إصدار مستقر.
DAT Linux | Distribution for Data Science
DAT Linux 1.0.1 (Install and Overview)
DAT Linux : Perfect Linux distro for DATA SCIENCE
DAT Linux The Data Science OS