Auteur Sujet: Incident sur filer4  (Lu 5914 fois)

0 Membres et 1 Invité sur ce sujet

Hors ligne serpico3

  • Débutant
  • *
  • Messages: 65
    • Politique
Re : Incident sur filer4
« Réponse #30 le: 10 novembre 2011 à 23:25:28 »
Thibaud, cela repart totalement en sucette. Il y a une manipulation en cours ? Merci.

Hors ligne mackil

  • Débutant
  • *
  • Messages: 4
    • PortGratuit.fr
Re : Incident sur filer4
« Réponse #31 le: 10 novembre 2011 à 23:51:06 »
@thibaud
1. Désolé mais tout ne fonctionne pas très bien. Le service n'est pas rétablit. Nous avons eu des coupures toute la journée. Et pour preuve nous avons le rapport du système de monitoring. Sans compter la coupure de 30 mn qui vient de se terminer.
2. L'incident filer dure depuis une semaine.
3. J'attends un peu plus d'un prestataire que de répondre si sèchement.

Si je comprends votre plan d'action est le votre et vous le communiquerez que quand vous jugerez utile.

Bon courage alors.

Hors ligne Jean.

  • Administrateur
  • Débutant
  • *****
  • Messages: 65
Re : Re : Incident sur filer4
« Réponse #32 le: 11 novembre 2011 à 01:51:07 »
@thibaud
1. Désolé mais tout ne fonctionne pas très bien. Le service n'est pas rétablit. Nous avons eu des coupures toute la journée. Et pour preuve nous avons le rapport du système de monitoring. Sans compter la coupure de 30 mn qui vient de se terminer.
2. L'incident filer dure depuis une semaine.
3. J'attends un peu plus d'un prestataire que de répondre si sèchement.

Si je comprends votre plan d'action est le votre et vous le communiquerez que quand vous jugerez utile.

Bon courage alors.
Pour ce qui est de la coupure de 23h, c'est cette fois la machine qui héberge les configurations apache qui à planté, cette dernière qui n'avait jamais posé problème plante juste quand on à réglé le problème de filer, ce n'est malheureusement pas de chance et ne semble même pas être un effet de bord, après avoir redémarré la machine et vérifié son bon fonctionnement, nous avons momentanément recoupé la machine pour la brancher sur un bandeau de prise électrique gérable à distance afin de pouvoir en cas de plantage de la machine la redémarrer immédiatement sans être sur place et nous avons déjà racké une machine possédant une interface IPMI que nous configureront dans les prochains jours pour pouvoir servir de serveur de secours en cas de problème et éventuellement remplacer le serveur actuel.

Pour information, Thibaud s'est levé à 4h30 hier matin et à du repartir après une journée à régler des problèmes de 23h à 1h du matin au datacenter pour régler ce dernier problème et me suis moi même déplacé bien qu'étant en congé, cela ne nous plait malheureusement pas plus que vous, surtout quand les problèmes ne sont pas prévisibles ou compréhensibles.


Pour ce qui est de filer4, nous avons dû basculer les clients de filer4 sur un serveur de backup dans la journée ; pendant ce temps, nous allons pouvoir "travailler" sur filer4 sans que cela n'impactes les utilisateurs.

Nous avons déjà contacté notre fournisseur de matériel pour qu'il nous renvoie un backplane (carte sur laquelle sont branché les disques) et une nappe SAS afin que nous puissions tester en changeant ces pièces, nous allons également mettre à jour le bios de la carte mère pour parer à toutes éventualités et faire des tests mémoire et processeur.
Si nous rencontrons toujours des problèmes, nous envisagerons de changer le matériel ne pouvant pas être vérifié.


En espérant avoir pu répondre correctement à vos questions.

Hors ligne bruno58

  • Habitué
  • **
  • Messages: 109
Re : Incident sur filer4
« Réponse #33 le: 11 novembre 2011 à 02:14:20 »
Bonjour,

J'ai suivi avec intérêt les différents soucis "mineurs" rencontrés cette semaine.
Même si au passage, le 23 octobre puis le 25 octobre je faisais déjà remarque de soucis SQL.

Je travaille quotidiennement sur mon site internet depuis deux mois, chose que je ne faisais pas avant, et depuis ce moment je m’aperçois que le service est constamment en train de tomber ! (coïncidence?)
Effectivement, ce c'est pas nécessairement des coupures d'une journée et heureusement, mais plutôt des micro-coupures puis coupures plus longues, erreurs de connexion, extrêmes lenteurs, etc...

Tout à l'heure vers 23h, votre site n'était même plus disponible, ni même le forum...
 
Le plus "drôle" c'est qu'a chaque problème le forum s'agite comme une fourmilière, et la discussion se termine toujours par "super, c'est pas grave, c'est cool, c'est réglé merci beaucoup"
À entendre ces clients, on à l'impression qu'ils sont soulagés que leurs données ne se soient pas envolées dans le cyber-espace. Mais n'est-ce pas intrinsèque un métier d'hébergeur ? N'est-ce pas le strict minimum attendu de la part d'un hébergeur, de savoir ses données en sécurité et d'avoir un taux de performance respectable sans être sans cesse a stresser et poster sur les forums dans l'attente d'une réponse ?

J'avoue avoir pensé a migrer mes sites tellement j'étais excédé, mais je prie pour ne pas en arriver la ne serait-ce que pour le temps perdu.
J'aimerai qu'on nous rassure et savoir si la situation va durer ?

Bonne soirée
Cordialement
B.
« Modifié: 11 novembre 2011 à 02:16:15 par bruno58 »

Hors ligne Nommam

  • Connaisseur
  • ***
  • Messages: 433
Re : Incident sur filer4
« Réponse #34 le: 11 novembre 2011 à 09:24:27 »
il serait interessant de mettre a jour ( ou plustot de remettre en route ) le monitoring : http://phpnet.org/monitoring.php

car les graph sont static depuis un an ( dans qq jours )!

Hors ligne JPC

  • Débutant
  • *
  • Messages: 15
Re : Re : Incident sur filer4
« Réponse #35 le: 11 novembre 2011 à 17:07:27 »
Bonjour

Je travaille quotidiennement sur mon site internet depuis deux mois, chose que je ne faisais pas avant, et depuis ce moment je m’aperçois que le service est constamment en train de tomber ! (coïncidence?)
Oui coïncidence.
Je suis tous les jours sur plusieurs sites et c'est vraiment très rare, même si c'est pénible.
Mercredi soir en pleine démo chez un prospect coupure... Du coup j'ai perdu quelques images installées ce soir là et qui n'ont pas survécues au basculement sur le backup.
Hier soir coup de pot j'étais au téléphone avec un autre client qui me demandais une bricole, je lui ai fait la modif sans problème, puis quelques minutes plus tard je suis revenu pour voir et re-coupure vers 23h08. Ouf c'était après la modif, c'est resté transparent pour le client.

Malgré tout cela faisais longtemps que ce n'était pas arrivé.
En principe on a droit à un geste commercial sur les mutualisés pro. Les premium n'ont pas été touchés, je me pose la question de savoir si ce serait judicieux de tout basculer en premium, mais il y a des pépins pour lesquels les premium seraient impactés eux-aussi.
Solution? Y'en a pas dans ces cas-là.


Hors ligne marckisscool

  • Dr TeiGnEuX
  • Expert
  • ****
  • Messages: 549
  • Dr TeiGnEuX
    • smfgratuit.fr
Re : Incident sur filer4
« Réponse #36 le: 12 novembre 2011 à 00:15:07 »
Je ne suis pas sur qu'il n'y a que le filer qui deconne, surtout quand on voit les temps de réponse du serveur sql cl1-sql7:
coupure du sql à 23:30
rétablissement à 23:50
à 00:05 Page générée en 36.64 secondes avec 29 requêtes.
à 00:09 Page générée en 31.628 secondes avec 29 requêtes.

+1 avec nommam

Bonne soirée

Hors ligne thibaud

  • VIP
  • *****
  • Messages: 3 909
    • http://www.phpnet.org/
Re : Incident sur filer4
« Réponse #37 le: 12 novembre 2011 à 01:16:41 »
il n'y a pas eu de coupure sur cl1-sql7 aux heures indiquées... (nous avons des tests : tcp, connexions sql, stats de requêtes, usage cpu), tout est normal aux heures indiquées.

Pouvez vous préciser, en ouvrant un ticket (ce sera plus simple pour nous), quelles erreurs sql vous avez eu (max_user_connections ?) a ce moment la ?

en ce qui concerne les temps de réponse, je n'ai rien d'anormal non plus aux heures indiquées mais si vous avez plus
d'éléments (node en charge des requêtes lentes par exemple), je suis preneur.

la page des graphs doit être changée, je l'ai mis dans la todo list d'il y a 2 semaines mais les évènements ont fait que l'on s'est concentré sur le plus urgent ... suivez mon regard :)
Thibaud GRANGIER
Division Technique mutualise-dedie
PHPNET

Hors ligne RobertG

  • Connaisseur
  • ***
  • Messages: 303
    • Robert Gastaud Conseils et Assistance
Re : Incident sur filer4
« Réponse #38 le: 12 novembre 2011 à 16:53:32 »
Bonjour,
Pour info : hier vers 17h30, en vérifiant les sites que je surveille et qui sont hébergés sur mon Premium, celui dont la base était sur cl1-sql7 était extrêmement lent pour l'affichage de l'accueil, un peu moins ensuite pour la navigation. J'ai migré la base sur cl1-sql6, vidé le cache de mon navigateur et retrouvé la vitesse habituelle d'accès à ce site. J'en ai conclu qu'il y avait un souci d'accès à ce serveur de base...
"Patience et longueur de temps font plus que force ni que rage..." (La Fontaine). MoovJla et LazyDbBackup sur www.joomxtensions.com - FaQ sur www.fontanil.info - site pro https://www.robertg-conseil.fr

Hors ligne marckisscool

  • Dr TeiGnEuX
  • Expert
  • ****
  • Messages: 549
  • Dr TeiGnEuX
    • smfgratuit.fr
Re : Incident sur filer4
« Réponse #39 le: 13 novembre 2011 à 08:01:42 »
Bonjour,

Perte des fichiers datants du 7-8-9 novembre 2011, obligé ce matin de vérifier les modifications faites dans la semaine.....  :huh:

Citer
il n'y a pas eu de coupure sur cl1-sql7 aux heures indiquées
Quand le serveur sql ne répond plus au serveur http en lui retournant un etat busy, pour moi le serveur sql est mort. Cela arrive pas mal de fois en journée et en soirée, il faudrait peut etre mettre un beat de surveillance sur l'etat et la charge de la machine....  :mellow:

C'est moi ou la qualité du mutualisé cette année c'est dégradée (panne à répétition, ralentissement, test de versions pourries, etc...)?
« Modifié: 13 novembre 2011 à 08:10:04 par marckisscool »

Hors ligne thibaud

  • VIP
  • *****
  • Messages: 3 909
    • http://www.phpnet.org/
Re : Re : Incident sur filer4
« Réponse #40 le: 13 novembre 2011 à 10:47:08 »

Quand le serveur sql ne répond plus au serveur http en lui retournant un etat busy, pour moi le serveur sql est mort. Cela arrive pas mal de fois en journée et en soirée, il faudrait peut etre mettre un beat de surveillance sur l'etat et la charge de la machine....  :mellow:


a quelle heure précise ? quelle erreur de socket ?
la charge de cl1-sql7 est bien monitorée et la machine est idlee a plus de 85% ...
Thibaud GRANGIER
Division Technique mutualise-dedie
PHPNET

Hors ligne marckisscool

  • Dr TeiGnEuX
  • Expert
  • ****
  • Messages: 549
  • Dr TeiGnEuX
    • smfgratuit.fr
Re : Re : Re : Incident sur filer4
« Réponse #41 le: 13 novembre 2011 à 13:06:45 »
a quelle heure précise ? quelle erreur de socket ?
la charge de cl1-sql7 est bien monitorée et la machine est idlee a plus de 85% ...
Idle à 85% et il faut plus de 30 secondes pour 29 requêtes:
à "00:05 Page générée en 36.64 secondes avec 29 requêtes" contre "Page générée en 0.179 secondes avec 29 requêtes" habituellement, c'est un pentium 2 le serveur sql  :huh:
je m'interroge de cette différence sans rien toucher  :huh:

Hors ligne thibaud

  • VIP
  • *****
  • Messages: 3 909
    • http://www.phpnet.org/
Re : Incident sur filer4
« Réponse #42 le: 13 novembre 2011 à 23:02:45 »
non, ce n'est pas un pentium 2 et je confirme sa charge.
mais rien ne prouve que cela venait du sql dans vos explications ... peut etre que le node http qui a traité la requete était chargé dans cette minute la ??!

root@cl1-sql7:~# cat /proc/cpuinfo
processor       : 0
vendor_id       : GenuineIntel
cpu family      : 6
model           : 26
model name      : Intel(R) Core(TM) i7 CPU         920  @ 2.67GHz
stepping        : 5
cpu MHz         : 1600.000
cache size      : 8192 KB
physical id     : 0
siblings        : 8
core id         : 0
cpu cores       : 4
apicid          : 0
initial apicid  : 0
fpu             : yes
fpu_exception   : yes
cpuid level     : 11
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology tsc_reliable nonstop_tsc pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm ida tpr_shadow vnmi flexpriority ept vpid
bogomips        : 5319.83
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

processor       : 1
vendor_id       : GenuineIntel
cpu family      : 6
model           : 26
model name      : Intel(R) Core(TM) i7 CPU         920  @ 2.67GHz
stepping        : 5
cpu MHz         : 2668.000
cache size      : 8192 KB
physical id     : 0
siblings        : 8
core id         : 1
cpu cores       : 4
apicid          : 2
initial apicid  : 2
fpu             : yes
fpu_exception   : yes
cpuid level     : 11
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology tsc_reliable nonstop_tsc pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm ida tpr_shadow vnmi flexpriority ept vpid
bogomips        : 5319.90
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

processor       : 2
vendor_id       : GenuineIntel
cpu family      : 6
model           : 26
model name      : Intel(R) Core(TM) i7 CPU         920  @ 2.67GHz
stepping        : 5
cpu MHz         : 1600.000
cache size      : 8192 KB
physical id     : 0
siblings        : 8
core id         : 2
cpu cores       : 4
apicid          : 4
initial apicid  : 4
fpu             : yes
fpu_exception   : yes
cpuid level     : 11
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology tsc_reliable nonstop_tsc pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm ida tpr_shadow vnmi flexpriority ept vpid
bogomips        : 5319.90
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

processor       : 3
vendor_id       : GenuineIntel
cpu family      : 6
model           : 26
model name      : Intel(R) Core(TM) i7 CPU         920  @ 2.67GHz
stepping        : 5
cpu MHz         : 1600.000
cache size      : 8192 KB
physical id     : 0
siblings        : 8
core id         : 3
cpu cores       : 4
apicid          : 6
initial apicid  : 6
fpu             : yes
fpu_exception   : yes
cpuid level     : 11
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology tsc_reliable nonstop_tsc pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm ida tpr_shadow vnmi flexpriority ept vpid
bogomips        : 5319.90
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

processor       : 4
vendor_id       : GenuineIntel
cpu family      : 6
model           : 26
model name      : Intel(R) Core(TM) i7 CPU         920  @ 2.67GHz
stepping        : 5
cpu MHz         : 1600.000
cache size      : 8192 KB
physical id     : 0
siblings        : 8
core id         : 0
cpu cores       : 4
apicid          : 1
initial apicid  : 1
fpu             : yes
fpu_exception   : yes
cpuid level     : 11
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology tsc_reliable nonstop_tsc pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm ida tpr_shadow vnmi flexpriority ept vpid
bogomips        : 5319.90
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

processor       : 5
vendor_id       : GenuineIntel
cpu family      : 6
model           : 26
model name      : Intel(R) Core(TM) i7 CPU         920  @ 2.67GHz
stepping        : 5
cpu MHz         : 1600.000
cache size      : 8192 KB
physical id     : 0
siblings        : 8
core id         : 1
cpu cores       : 4
apicid          : 3
initial apicid  : 3
fpu             : yes
fpu_exception   : yes
cpuid level     : 11
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology tsc_reliable nonstop_tsc pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm ida tpr_shadow vnmi flexpriority ept vpid
bogomips        : 5319.90
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

processor       : 6
vendor_id       : GenuineIntel
cpu family      : 6
model           : 26
model name      : Intel(R) Core(TM) i7 CPU         920  @ 2.67GHz
stepping        : 5
cpu MHz         : 1600.000
cache size      : 8192 KB
physical id     : 0
siblings        : 8
core id         : 2
cpu cores       : 4
apicid          : 5
initial apicid  : 5
fpu             : yes
fpu_exception   : yes
cpuid level     : 11
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology tsc_reliable nonstop_tsc pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm ida tpr_shadow vnmi flexpriority ept vpid
bogomips        : 5319.91
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

processor       : 7
vendor_id       : GenuineIntel
cpu family      : 6
model           : 26
model name      : Intel(R) Core(TM) i7 CPU         920  @ 2.67GHz
stepping        : 5
cpu MHz         : 1600.000
cache size      : 8192 KB
physical id     : 0
siblings        : 8
core id         : 3
cpu cores       : 4
apicid          : 7
initial apicid  : 7
fpu             : yes
fpu_exception   : yes
cpuid level     : 11
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology tsc_reliable nonstop_tsc pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm ida tpr_shadow vnmi flexpriority ept vpid
bogomips        : 5319.91
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:


Linux 2.6.31-22-server (cl1-sql7)       13/11/2011      _x86_64_        (8 CPU)

00:00:01        CPU     %user     %nice   %system   %iowait    %steal     %idle
00:05:01        all     12,69      0,00      3,63      3,81      0,00     79,88
00:15:01        all     15,85      0,00      3,80      2,83      0,00     77,51
00:25:01        all     15,71      0,00      4,38      3,80      0,00     76,10
00:35:01        all      7,12      0,00      1,94      2,69      0,00     88,25
00:45:01        all      4,71      0,00      1,29      2,70      0,00     91,30
00:55:01        all      4,50      0,00      0,96      2,01      0,00     92,53
01:05:01        all      5,66      0,00      1,20      2,00      0,00     91,14
01:15:01        all      4,94      0,00      1,14      2,51      0,00     91,41
01:25:01        all      9,23      0,00      2,12      1,66      0,00     86,99
01:35:01        all     12,55      0,00      3,23      1,68      0,00     82,55
01:45:01        all     13,78      0,00      3,11      2,92      0,00     80,18
01:55:01        all      7,40      0,00      1,67      2,00      0,00     88,94
02:05:01        all      8,05      0,00      2,09      2,30      0,00     87,56
02:15:01        all     13,02      0,00      3,40      2,13      0,00     81,45
02:25:01        all     13,30      0,00      3,38      2,41      0,00     80,91
02:35:01        all     12,93      0,00      3,27      2,36      0,00     81,44
02:45:01        all     12,44      0,00      3,32      2,16      0,00     82,08
02:55:01        all     12,18      0,00      3,16      2,95      0,00     81,71
03:05:01        all     12,57      0,00      3,27      1,79      0,00     82,36
03:15:01        all     12,67      0,00      3,17      2,34      0,00     81,82
03:25:01        all     13,06      0,00      3,34      3,50      0,00     80,10
03:35:01        all     11,42      0,00      3,13      2,77      0,00     82,69
03:45:01        all     12,02      0,00      3,27      1,50      0,00     83,22
03:55:01        all     12,90      0,00      3,28      1,61      0,00     82,21
04:05:01        all     16,29      0,00      4,34      2,87      0,00     76,50
04:15:01        all      6,52      0,00      1,85      4,27      0,00     87,36
04:25:02        all      6,86      0,00      1,43      1,44      0,00     90,27
04:35:01        all      4,18      0,00      1,03      2,54      0,00     92,24
04:45:01        all      4,85      0,00      1,00      2,66      0,00     91,49
04:55:01        all      4,57      0,00      0,78      1,03      0,00     93,61
05:05:01        all      4,24      0,00      0,90      1,59      0,00     93,27
05:15:01        all      3,99      0,00      1,05      1,68      0,00     93,27
05:25:01        all      7,88      0,00      2,03      1,35      0,00     88,74
05:35:01        all      6,04      0,00      1,50      1,51      0,00     90,95
05:45:01        all      4,33      0,00      0,99      2,24      0,00     92,45
05:55:01        all      6,03      0,00      1,76      1,78      0,00     90,43
06:05:01        all      3,21      0,00      1,07      2,01      0,00     93,71
06:15:01        all      7,70      0,00      2,08      2,99      0,00     87,24
06:25:01        all      6,57      0,00      1,57      1,78      0,00     90,08
06:35:01        all      4,05      0,00      1,12      1,21      0,00     93,62
06:45:01        all      4,66      0,00      1,06      2,12      0,00     92,16
06:55:01        all      4,38      0,00      1,10      2,58      0,00     91,93
07:05:01        all      4,45      0,00      1,13      2,02      0,00     92,40
07:15:01        all      6,77      0,00      1,25      1,98      0,00     90,00

07:15:01        CPU     %user     %nice   %system   %iowait    %steal     %idle
07:25:01        all      5,95      0,00      1,23      2,68      0,00     90,14
07:35:01        all      6,00      0,00      1,25      2,43      0,00     90,32
07:45:01        all      5,08      0,00      1,24      1,94      0,00     91,74
07:55:01        all      4,00      0,00      1,05      2,15      0,00     92,81
08:05:01        all      8,84      0,00      2,34      2,64      0,00     86,17
08:15:01        all      9,58      0,00      2,36      2,31      0,00     85,75
08:25:01        all      8,87      0,00      2,59      3,55      0,00     84,99
08:35:01        all      5,41      0,00      1,47      2,28      0,00     90,85
08:45:01        all      5,79      0,00      1,49      1,90      0,00     90,82
08:55:01        all      5,98      0,00      1,49      2,31      0,00     90,22
09:05:01        all      5,80      0,00      1,64      2,69      0,00     89,87
09:15:01        all      7,94      0,00      2,49      2,65      0,00     86,93
09:25:01        all      4,59      0,00      2,45      2,62      0,00     90,34
09:35:01        all      5,24      0,00      2,35      3,39      0,00     89,02
09:45:01        all      3,91      0,00      1,80      3,65      0,00     90,64
09:55:01        all      3,27      0,00      2,16      3,40      0,00     91,17
10:05:01        all      5,09      0,00      2,47      3,81      0,00     88,63
10:15:01        all      3,75      0,00      2,16      2,25      0,00     91,85
10:25:01        all      3,20      0,00      1,87      2,12      0,00     92,81
10:35:01        all      3,54      0,00      2,06      3,21      0,00     91,19
10:45:01        all      4,00      0,00      1,76      3,11      0,00     91,12
10:55:01        all      3,12      0,01      1,59      3,11      0,00     92,17
11:05:01        all      5,18      0,00      3,26      3,12      0,00     88,44
11:15:01        all      3,63      0,00      1,63      3,82      0,00     90,92
11:25:01        all      5,22      0,00      1,94      3,13      0,00     89,71
11:35:01        all      4,31      0,00      1,61      3,35      0,00     90,72
11:45:01        all      9,18      0,00      2,55      2,87      0,00     85,40
11:55:01        all      7,74      0,00      2,25      2,89      0,00     87,11
12:05:01        all      4,97      0,00      1,65      4,46      0,00     88,91
12:15:01        all      8,78      0,00      2,80      4,27      0,00     84,14
12:25:01        all     13,70      0,00      4,25      5,86      0,00     76,19
12:35:01        all     12,74      0,00      3,64      3,10      0,00     80,53
12:45:01        all      6,54      0,00      1,91      3,87      0,00     87,68
12:55:01        all      5,21      0,00      1,84      3,95      0,00     89,00
13:05:01        all      5,83      0,00      1,77      3,43      0,00     88,96
13:15:01        all      9,50      0,00      8,27      3,01      0,00     79,22
13:25:01        all      6,49      0,00      2,48      3,87      0,00     87,16
13:35:01        all      5,07      0,00      1,90      3,40      0,00     89,63
13:45:01        all      5,92      0,00      1,98      4,00      0,00     88,11
13:55:01        all      5,06      0,00      1,78      4,07      0,00     89,09
14:05:01        all      5,68      0,00      1,64      3,21      0,00     89,47
14:15:01        all      4,97      0,00      1,82      3,63      0,00     89,57
14:25:01        all      5,89      0,00      1,87      4,71      0,00     87,53
14:35:01        all      5,24      0,00      1,68      3,88      0,00     89,20

14:35:01        CPU     %user     %nice   %system   %iowait    %steal     %idle
14:45:01        all      4,76      0,00      1,99      3,90      0,00     89,35
14:55:01        all      5,97      0,00      2,05      5,06      0,00     86,91
15:05:01        all      7,23      0,00      2,17      4,04      0,00     86,56
15:15:01        all      5,20      0,00      1,69      3,27      0,00     89,84
15:25:01        all      6,47      0,00      1,83      4,37      0,00     87,32
15:35:01        all      5,30      0,00      1,63      2,92      0,00     90,15
15:45:01        all      4,42      0,00      1,49      2,61      0,00     91,48
15:55:01        all      5,56      0,00      1,53      3,53      0,00     89,38
16:05:01        all      5,32      0,00      1,85      3,81      0,00     89,01
16:15:01        all      6,43      0,00      1,78      4,43      0,00     87,36
16:25:02        all      6,53      0,00      1,63      3,48      0,00     88,35
16:35:01        all      5,92      0,00      1,94      3,20      0,00     88,94
16:45:01        all      5,20      0,00      1,98      4,21      0,00     88,61
16:55:01        all      5,67      0,00      1,88      3,82      0,00     88,63
17:05:01        all      7,19      0,00      2,53      3,51      0,00     86,76
17:15:01        all      6,00      0,00      1,90      3,88      0,00     88,22
17:25:01        all      9,10      0,00      2,40      4,88      0,00     83,62
17:35:01        all      6,98      0,00      2,28      4,82      0,00     85,92
17:45:01        all      5,30      0,00      1,80      4,52      0,00     88,38
17:55:01        all      5,21      0,00      1,96      3,85      0,00     88,98
18:05:01        all      9,18      0,00      2,27      4,69      0,00     83,86
18:15:01        all     11,16      0,00      3,46      4,63      0,00     80,75
18:25:01        all      7,64      0,00      2,68      4,06      0,00     85,62
18:35:01        all      9,85      0,00      3,29      4,41      0,00     82,45
18:45:01        all      8,38      0,00      3,02      4,40      0,00     84,20
18:55:01        all      6,26      0,00      2,18      4,58      0,00     86,99
19:05:01        all      9,39      0,00      2,50      4,13      0,00     83,98
19:15:01        all     15,25      0,00      3,09      4,24      0,00     77,42
19:25:01        all     14,00      0,00      2,83      3,83      0,00     79,34
19:35:01        all     17,27      0,00      4,12      4,69      0,00     73,92
19:45:01        all     12,60      0,00      2,81      4,74      0,00     79,86
19:55:01        all     11,59      0,00      2,54      4,68      0,00     81,19
20:05:01        all     10,10      0,00      2,44      3,84      0,00     83,61
20:15:01        all      6,25      0,00      2,09      3,76      0,00     87,90
20:25:01        all      4,35      0,00      1,90      3,97      0,00     89,79
20:35:01        all      5,62      0,00      2,05      3,52      0,00     88,81
20:45:01        all      5,36      0,00      1,89      4,32      0,00     88,43
20:55:01        all      5,20      0,00      1,84      4,40      0,00     88,56
21:05:01        all     11,51      0,00      3,12      3,73      0,00     81,64
21:15:01        all     14,53      0,00      4,12      3,37      0,00     77,98
21:25:01        all     14,59      0,00      4,13      3,53      0,00     77,74
21:35:01        all     15,17      0,00      4,43      2,97      0,00     77,42
21:45:01        all     13,82      0,00      4,25      4,19      0,00     77,74
21:55:01        all      6,38      0,00      1,84      4,21      0,00     87,56

21:55:01        CPU     %user     %nice   %system   %iowait    %steal     %idle
22:05:01        all      5,54      0,00      1,73      3,83      0,00     88,91
22:15:01        all      6,09      0,00      1,98      3,74      0,00     88,18
22:25:01        all      6,30      0,00      1,87      4,28      0,00     87,54
22:35:01        all      4,56      0,01      1,75      3,68      0,00     90,00
22:45:01        all      4,38      0,01      1,84      2,67      0,00     91,10
22:55:01        all      4,43      0,01      1,49      3,07      0,00     91,00
Moyenne :       all      7,51      0,00      2,23      3,19      0,00     87,06

il faudrait du coup l'ip du node qui a "merdé" car pour moi, cela n'a rien a voir avec le sql... mais bon !
« Modifié: 13 novembre 2011 à 23:05:20 par thibaud »
Thibaud GRANGIER
Division Technique mutualise-dedie
PHPNET

Hors ligne thibaud

  • VIP
  • *****
  • Messages: 3 909
    • http://www.phpnet.org/
Re : Incident sur filer4
« Réponse #43 le: 13 novembre 2011 à 23:05:39 »
root@cl1-sql7:~# free
             total       used       free     shared    buffers     cached
Mem:      12321944   12056372     265572          0     288588    6408024
-/+ buffers/cache:    5359760    6962184
Swap:     19920520     656956   19263564
Thibaud GRANGIER
Division Technique mutualise-dedie
PHPNET

Hors ligne thibaud

  • VIP
  • *****
  • Messages: 3 909
    • http://www.phpnet.org/
Re : Incident sur filer4
« Réponse #44 le: 14 novembre 2011 à 17:22:33 »
Bonsoir,

les choses avancent au plus vite pour solutionner définitivement ces soucis de filers.

Aujourd'hui, nous avons commandé le matériel pour le montage d'un filer supplémentaire. Le but final est de doubler l'ensemble de nos filers en utilisant une réplication "en live" des données et utiliser les 2 filers en mode active/active.

Cela permettra :
1) de limiter au maximum les problème grace a la redondance sans intervention de notre part
2) d'améliorer les performances d'accès aux données
3) de sécuriser encore plus le stockage des données (puisqu'elles seront stockées sur 2 serveurs simultanément en permanence + sur un serveur de backup)
4) d'avoir des machines de stockage physiquement différentes (carte raid, carte mère, cpu, ram, disques).

Ce qui est compliqué (pour ne pas dire -très- compliqué) en ce moment c'est de nous approvisionner en disques car les inondations en Thaïlande bloquent tout...
Nous avons quand même réussi a en avoir (merci Eliane d'ailleurs!) mais nous ne savons pas s'il va être possible de généraliser cela au niveau de nos filers avant la fin de l'année car trouver des grosses quantités de disques en ce moment relève du défi et coute ... trois bras !

Bref, nous allons continuer et améliorer les choses aussi vite que possible.

La mise en place de ce système de stockage -très- différent va prendre un peu de temps quand même car il faut faire beaucoup de tests avant la mise en production, préparer le matériel etc. Je pense que dans 2 semaines environ nous pourrons y voir plus clair...

Merci a ceux qui nous encouragent en tout cas. Notre but est de vous satisfaire, pas d'avoir des problèmes... En tant que dirigeant de PHPNET, je n'ai -jamais- privilégié les bénéfices aux investissements. Nous investissons énormément et malgré cela, dès qu'un problème apparait, la question financière ne se pose même pas pour pouvoir le solutionner définitivement.

Je vous tiens informé rapidement sur la suite des opérations.
Thibaud GRANGIER
Division Technique mutualise-dedie
PHPNET